python train_cmd.py
python train.py --algo sac --env BounceBall_Pybullet_env-v0 -P python train.py --algo sac --env BounceBall_Pybullet_env-v0 --vec-env subproc --n-eval-envs 3 --eval-freq 5000 -P
python train.py --algo sac --env BounceBall_Pybullet_env-v0 -n 50000 -optimize --n-trials 100 --n-jobs 1 --sampler tpe --pruner median --n-evaluations 10000 --n-eval-envs 2 --verbose 0 --vec-env subproc -P
python -m enjoy--algo sac --env BounceBall_Pybullet_env-v0 -f logs/ --exp-id 2 python enjoy.py --algo sac --env BounceBall_Pybullet_env-v0 -f logs/ --exp-id 2 --env-kwargs gym_render:True python enjoy.py --algo sac --env BounceBall_Pybullet_env-v0 -f logs/ --exp-id 16 --load-best --best-n 0 --env-kwargs gym_render:True
python train.py --algo sac --env BounceBallPyBullet-v0 -i ./logs/sac/BounceBallPyBullet-v0_1/best_model.zip -n 500000 --tensorboard-log ./logs/sac/BounceBallPyBullet-v0_1 --verbose 1