Laissez le robot préparer un hamburger de A à Z ! Progrès incroyable dans la manipulation habile à long terme. La vision seule est souvent insuffisante : ce travail intègre intelligemment la détection tactile haute résolution via l'apprentissage cross-modal. ViTacFormer anticipe non seulement le contact, mais permet également un apprentissage par imitation robuste avec des mains anthropomorphes. Un jalon pour le contrôle robotique multimodal.
Haoran Geng
Haoran Geng8 juil., 23:15
🤖 Que se passerait-il si un robot humanoïde pouvait préparer un hamburger à partir d'ingrédients bruts—directement jusqu'à votre assiette ? 🔥 Nous sommes ravis d'annoncer ViTacFormer : notre nouvelle chaîne pour une manipulation habile de niveau supérieur avec vision active + toucher haute résolution. 🎯 Pour la première fois, nous démontrons environ 2,5 minutes de contrôle autonome continu—combinant vision active, toucher haute résolution et mains robotiques à haute DoF SharpaWave — pour réaliser des tâches complexes dans le monde réel. Le code est entièrement publié ; consultez notre : Page d'accueil : Lien vers le document : Github :
3,66K