A mers la laboratorul lui @DvijKalaria @berkeley_ai și a jucat ping-pong împotriva robotului său, Oreo. Jucasem mult ping-pong când eram copil. A părut potrivit de ireal și unul dintre acele momente de genul "Mi-aș dori să-mi spun asta din liceu". Tenisul de masă este unul dintre sporturile mai dificile de practicat pentru roboți. Mingea poate ajunge la 30+ mph cu o rotație puternică, intenția adversarului uman este ascunsă, iar întregul corp trebuie să se coordoneze. Oreo este un umanoid complet ținând o paletă adevărată și a învățat mișcări cheie precum leagănul urmărindu-l pe Dvij demonstrând. Nicio dată de antrenament colectată de roboți. O persoană prezintă moțiunea, politica se generalizează. Așa cum funcționează, așa cum am înțeles eu: - Un sistem inteligent (un planificator ierarhic) stabilește mai întâi unde va zbura mingea și alege cel mai bun tip de lovitură, cum ar fi un forehand sau backhand. - Acest plan ajută apoi la antrenarea "creierului" robotului (o politică RL) într-o simulare virtuală. Creierul învață prin încercări și erori, primind recompense când imită câteva mișcări exemplu - Odată antrenat în simulare, întreaga configurație se aplică robotului fizic propriu-zis pentru ca acesta să poată juca cu adevărat. Demonstrațiile umane sunt, în esență, mișcările de referință. Ei construiesc un robot care a urmărit mai mult tenis de masă uman decât orice om și îl folosește pentru a-și dezvolta propriul joc. Tot am câștigat. (Cu greu. Dar asta nu va dura)
Urmărește munca lui Dvij aici: Și mulțumesc @hananyss că m-ai lăsat să vin cu tine!
385