Nós trocamos robôs humanóides para Cristiano Ronaldo, LeBron James e Kobe Byrant! Estas são redes neurais rodando em hardware real em nosso laboratório GEAR. A maioria das demonstrações de robôs que você vê online acelera os vídeos. Na verdade, nós * desaceleramos * para que você possa aproveitar os movimentos fluidos. Estou animado para anunciar "ASAP", um modelo "real2sim2real" que domina movimentos extremamente suaves e dinâmicos para controle de corpo inteiro humanóide. Nós pré-treinamos o robô na simulação primeiro, mas há uma lacuna notória "sim2real": é muito difícil para as equações físicas projetadas à mão corresponderem à dinâmica do mundo real. Nossa correção é simples: basta implantar uma política pré-treinada em hardware real, coletar dados e reproduzir o movimento no simulador. O replay obviamente terá muitos erros, mas isso dá um sinal rico para compensar a discrepância física. Use outra rede neural para aprender o delta. Basicamente, "consertamos" um mecanismo de física tradicional, para que o robô possa experimentar quase o mundo real em escala em GPUs. O futuro é a simulação híbrida: combine o poder dos mecanismos de simulação clássicos refinados ao longo de décadas e a incrível capacidade dos NNs modernos de capturar um mundo confuso.
543,15K