Deixe o robô fazer um hambúrguer do zero! Progresso incrível na manipulação hábil de longo horizonte. A visão por si só muitas vezes fica aquém - este trabalho integra de forma inteligente a detecção tátil de alta resolução por meio do aprendizado intermodal. O ViTacFormer não apenas antecipa o contato, mas também permite um aprendizado robusto de imitação com mãos antropomórficas. Um marco para o controle robótico multimodal.
Haoran Geng
Haoran Geng8 de jul., 23:15
🤖 E se um robô humanóide pudesse fazer um hambúrguer com ingredientes crus - até o seu prato? 🔥 Temos o prazer de anunciar o ViTacFormer: nosso novo pipeline para manipulação hábil de próximo nível com visão ativa + toque de alta resolução. 🎯 Pela primeira vez, demonstramos ~ 2,5 minutos de controle contínuo e autônomo - combinando visão ativa, toque de alta resolução e mãos robóticas de alta DoF SharpaWave - para concluir tarefas complexas do mundo real. O código é totalmente liberado; Confira nosso: Página inicial: Link do artigo: Github:
3,64K