Gick till @DvijKalaria labb @berkeley_ai och spelade pingis mot hans robot, Oreo. Jag hade spelat massor av pingis som barn. Det kändes passande overkligt och en av de där "Jag önskar att jag kunde berätta för mitt gymnasiejag om det här"-ögonblick. Bordtennis är en av de svårare sporterna för robotar att spela. Bollen kan röra sig upp till 30+ mph med kraftig spinn, motståndarens avsikt är dold och hela kroppen måste samordnas. Oreo är en fullvärdig humanoid som håller en riktig paddel, och den lärde sig viktiga rörelser som svingar genom att se Dvij demonstrera. Ingen träningsdata insamlad av robotar. En person visar motionen, policyn generaliseras. Så fungerar det, så som jag förstod det: - Ett smart system (en hierarkisk planerare) räknar först ut vart bollen ska flyga och väljer den bästa typen av slag, som en forehand- eller backhandsving. - Denna plan hjälper sedan till att träna robotens "hjärna" (en RL-policy) i en virtuell simulering. Hjärnan lär sig genom trial and error och får belöningar när den härmar några exempelrörelser - När den väl är tränad i simulatorn appliceras hela upplägget på den faktiska fysiska roboten så att den kan spela på riktigt. De mänskliga demonstrationerna är i princip referensrörelserna. De bygger en robot som har sett mer mänsklig bordtennis än någon människa, och använder den för att utveckla sitt eget spel. Jag vann ändå. (Nästan. Men det kommer inte att vara för evigt)
Följ Dvijs arbete här: Och tack @hananyss att jag fick följa med!
342