Lancement de PPO, une nouvelle classe d'algorithmes d'apprentissage par renforcement qui excellent dans les tâches de robotique simulée :