Eric Jang veier inn på RL vs. veiledet læring for humanoide robotmanipulasjonsoppgaver.
10,34K