Deixe o robô fazer um hambúrguer do zero! Progresso incrível na manipulação destroça de longo alcance. A visão sozinha muitas vezes não é suficiente—este trabalho integra de forma inteligente a sensibilidade tátil de alta resolução através da aprendizagem cross-modal. O ViTacFormer não só antecipa o contato, mas também permite uma aprendizagem robusta por imitação com mãos antropomórficas. Um marco para o controlo robótico multimodal.
Haoran Geng
Haoran Geng8/07, 23:15
🤖 E se um robô humanoide pudesse fazer um hambúrguer a partir de ingredientes crus—diretamente para o seu prato? 🔥 Estamos entusiasmados em anunciar o ViTacFormer: nosso novo pipeline para manipulação destroça de próximo nível com visão ativa + toque de alta resolução. 🎯 Pela primeira vez, demonstramos ~2,5 minutos de controle contínuo e autônomo—combinando visão ativa, toque de alta resolução e mãos robóticas de alta DoF SharpaWave — para completar tarefas complexas do mundo real. O código está totalmente liberado; confira nosso: Página inicial: Link do artigo: Github:
3,64K