Reinforcement Learning Examples

Pong environment

Policy Gradients
Checkpoint weights

Lunar Lander environment

Deep Q-Network
Checkpoint weights

Policy Gradients
Checkpoint weights

Cartpole environment

Policy Gradients
Checkpoint weights

Deep Q-Network
Checkpoint weights

Mario environment

Policy Gradients
Checkpoint weights

Plot of average reward per 10 episodes

Double Deep Q-Network
Checkpoint weights

Plot of average reward per 10 episodes

PPO+GAE
Checkpoint weights

Plot of average reward per 10 episodes

Highway environments

Highway environnment

video.mp4

Double Deep Q-Network
Checkpoint weights

Merge environnment

video.mp4

Double Deep Q-Network
Checkpoint weights

Roundabout environnment

video.mp4

Double Deep Q-Network
Checkpoint weights

Intersection environnment

video.mp4

Double Deep Q-Network
Checkpoint weights

Parking environnment

video.mp4

PPO+GAE
Checkpoint weights

PyBullet Walker2D environment

video.mp4

PPO+GAE
Checkpoint weights

Plot of average reward per 50 episodes