Jag observerar en mini-Moravecs paradox inom robotik: gymnastik som är svår för människor är mycket lättare för robotar än "osexiga" uppgifter som matlagning, städning och montering. Det leder till en kognitiv dissonans för människor utanför fältet, "så, robotar kan parkour och breakdance, men varför kan de inte ta hand om min hund?" Tro mig, jag fick frågan av mina föräldrar om detta mer än du tror ... "Robot Moravecs paradox" skapar också en illusion av att fysiska AI-funktioner är mycket mer avancerade än de egentligen är. Jag pekar inte ut Unitree, eftersom det gäller i stor utsträckning för alla de senaste akrobatiska demos i branschen. Här är ett enkelt test: om du sätter upp en vägg framför den sidovändande roboten kommer den att smälla in i den med full kraft och göra ett spektakel. För det är bara att överanpassa den där enda referensrörelsen, utan någon medvetenhet om omgivningen. Här är varför paradoxen finns: det är mycket lättare att träna en "blind gymnast" än en robot som ser och manipulerar. Det förstnämnda kan lösas helt i simulering och överföras nollskott till den verkliga världen, medan det senare kräver extremt realistisk rendering, kontaktfysik och rörig objektdynamik i den verkliga världen - varav ingen kan simuleras bra. Föreställ dig att du kan träna LLM:er inte från internet, utan från ett rent handgjort textkonsolspel. Robotikerna hade tur. Vi råkar leva i en värld där accelererade fysikmotorer är så bra att vi kan komma undan med imponerande akrobatik med bokstavligen noll verkliga data. Men vi har ännu inte upptäckt samma fuskkod för allmän fingerfärdighet. Tills dess kommer vi fortfarande att bli ifrågasatta av våra förvirrade föräldrar.
339,93K