Eric Jang wypowiada się na temat RL w porównaniu do uczenia nadzorowanego w zadaniach manipulacji humanoidalnych robotów.
10,36K