¡Deja que el robot haga una hamburguesa desde cero! Increíble progreso en la manipulación hábil a largo plazo. La visión por sí sola a menudo se queda corta; este trabajo integra de manera inteligente la detección táctil de alta resolución a través del aprendizaje multimodal. ViTacFormer no solo anticipa el contacto, sino que también permite un aprendizaje de imitación robusto con manos antropomórficas. Un hito para el control robótico multimodal.
Haoran Geng
Haoran Geng8 jul, 23:15
🤖 ¿Qué pasaría si un robot humanoide pudiera hacer una hamburguesa a partir de ingredientes crudos—todo hasta tu plato? 🔥 Emocionados de anunciar ViTacFormer: nuestra nueva línea para manipulación hábil de siguiente nivel con visión activa + tacto de alta resolución. 🎯 Por primera vez, demostramos ~2.5 minutos de control autónomo continuo—combinando visión activa, tacto de alta resolución y manos robóticas de alta DoF SharpaWave—para completar tareas complejas del mundo real. El código está completamente liberado; consulta nuestra: Página principal: Enlace del artículo: Github:
3,65K