Lass den Roboter einen Hamburger von Grund auf zubereiten! Unglaubliche Fortschritte bei der geschickten Manipulation über lange Zeiträume. Allein die Vision reicht oft nicht aus – diese Arbeit integriert intelligent hochauflösende taktile Sensorik durch cross-modales Lernen. ViTacFormer antizipiert nicht nur den Kontakt, sondern ermöglicht auch robustes Imitationslernen mit anthropomorphen Händen. Ein Meilenstein für die multimodale Robotersteuerung.
Haoran Geng
Haoran Geng8. Juli, 23:15
🤖 Was wäre, wenn ein humanoider Roboter einen Hamburger aus rohen Zutaten zubereiten könnte – direkt auf deinen Teller? 🔥 Wir freuen uns, ViTacFormer anzukündigen: unsere neue Pipeline für die nächste Stufe der geschickten Manipulation mit aktiver Vision + hochauflösendem Tastsinn. 🎯 Zum ersten Mal demonstrieren wir ~2,5 Minuten kontinuierliche, autonome Kontrolle – kombiniert mit aktiver Vision, hochauflösendem Tastsinn und hochgradig beweglichen Roboterhänden SharpaWave – um komplexe, reale Aufgaben zu erledigen. Der Code ist vollständig veröffentlicht; schau dir unsere an: Homepage: Paper-Link: Github:
3,64K