Eric Jang menimbang RL vs. pembelajaran yang diawasi untuk tugas manipulasi robot humanoid.
10,34K