Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ich war im Labor von @DvijKalaria @berkeley_ai und habe Tischtennis gegen seinen Roboter Oreo gespielt. Ich habe als Kind viel Tischtennis gespielt. Das fühlte sich angemessen surreal an und war einer dieser "Ich wünschte, ich könnte meinem Highschool-Ich davon erzählen"-Momente.
Tischtennis ist einer der schwierigeren Sportarten für Roboter. Der Ball kann mit über 30 mph und starkem Spin fliegen, die Absicht des menschlichen Gegners ist verborgen, und der ganze Körper muss koordiniert werden. Oreo ist ein vollwertiger Humanoid, der einen echten Schläger hält, und er hat wichtige Bewegungen wie Schläge gelernt, indem er Dvij zusah. Keine von Robotern gesammelten Trainingsdaten. Eine Person zeigt die Bewegung, die Strategie verallgemeinert.
So funktioniert es, wie ich es verstanden habe:
- Ein intelligentes System (ein hierarchischer Planer) ermittelt zuerst, wohin der Ball fliegen wird, und wählt die beste Art des Schlags, wie einen Vorhand- oder Rückhandschlag.
- Dieser Plan hilft dann, das "Gehirn" des Roboters (eine RL-Politik) in einer virtuellen Simulation zu trainieren. Das Gehirn lernt durch Versuch und Irrtum und erhält Belohnungen, wenn es einige Beispielbewegungen nachahmt.
- Sobald es in der Simulation trainiert ist, wird das gesamte Setup auf den tatsächlichen physischen Roboter angewendet, damit er wirklich spielen kann.
Die menschlichen Demonstrationen sind im Wesentlichen die Referenzbewegungen.
Sie bauen einen Roboter, der mehr menschliches Tischtennis gesehen hat als jeder Mensch, und nutzt das, um sein eigenes Spiel zu entwickeln.
Ich habe trotzdem gewonnen. (Knapp. Aber das wird nicht lange halten)
Folge Dvijs Arbeit hier:
Und danke @hananyss, dass ich mitkommen durfte!
289
Top
Ranking
Favoriten
