Eric Jang avalia RL vs. aprendizado supervisionado para tarefas de manipulação de robôs humanóides.
10,36K