Дозвольте роботу зробити гамбургер з нуля! Неймовірний прогрес на далеких горизонтальних спритних маніпуляціях. Одного лише зору часто не вистачає — ця робота розумно інтегрує тактильне відчуття високої роздільної здатності за допомогою крос-модального навчання. ViTacFormer не тільки передбачає контакт, але й забезпечує надійне імітаційне навчання за допомогою антропоморфних рук. Важлива віха для мультимодального роботизованого керування.
Haoran Geng
Haoran Geng8 лип., 23:15
🤖 What if a humanoid robot could make a hamburger from raw ingredients—all the way to your plate? 🔥 Excited to announce ViTacFormer: our new pipeline for next-level dexterous manipulation with active vision + high-resolution touch. 🎯 For the first time ever, we demonstrate ~2.5 minutes of continuous, autonomous control—combining active vision, high-res touch, and high-DoF robot hands SharpaWave — to complete complex, real-world tasks. Code is fully released; check out our: Homepage: Paper link: Github:
3,64K