Hãy để robot làm một chiếc hamburger từ đầu! Tiến bộ đáng kinh ngạc trong việc thao tác khéo léo với tầm nhìn dài hạn. Chỉ dựa vào thị giác thường không đủ - công trình này thông minh tích hợp cảm biến xúc giác độ phân giải cao thông qua học tập đa phương thức. ViTacFormer không chỉ dự đoán được sự tiếp xúc, mà còn cho phép học tập bắt chước mạnh mẽ với bàn tay giống người. Một cột mốc cho điều khiển robot đa phương thức.
Haoran Geng
Haoran Geng23:15 8 thg 7
🤖 What if a humanoid robot could make a hamburger from raw ingredients—all the way to your plate? 🔥 Excited to announce ViTacFormer: our new pipeline for next-level dexterous manipulation with active vision + high-resolution touch. 🎯 For the first time ever, we demonstrate ~2.5 minutes of continuous, autonomous control—combining active vision, high-res touch, and high-DoF robot hands SharpaWave — to complete complex, real-world tasks. Code is fully released; check out our: Homepage: Paper link: Github:
3,66K