Vydáváme PPO, novou třídu algoritmů posilovaného učení, které vynikají v simulovaných robotických úkolech: