@DvijKalariaの研究室@berkeley_aiに行って、彼のロボット、オレオと卓球をした。子供の頃、たくさん卓球をしていました。これはちょうどシュールな感覚で、「高校時代の自分に話せたらいいのに」という瞬間の一つでした。 卓球はロボットにとって最も難しいスポーツの一つです。ボールは最大30+mphまで回転し、激しい回転があり、相手の意図は隠され、全身が連携しなければなりません。オレオは本物のパドルを持つ完全なヒューマノイドで、ドヴィジの実演を見てブランコなどのキー動作を学びました。ロボットが収集した訓練データもありません。一人が動議を示し、方針は一般化されます。 仕組みは、私の理解では以下の通りです: - スマートシステム(階層的プランナー)はまずボールがどこに飛ぶかを決め、フォアハンドやバックハンドスイングのような最適な打撃タイプを選びます。 - この計画は、ロボットの「脳」(強化学習ポリシー)を仮想シミュレーションで訓練するのに役立ちます。脳は試行錯誤で学び、いくつかの例の動きを模倣すると報酬を得る - シム内で訓練が完了すると、全体のセットアップが実際の物理的なロボットに適用され、実際にプレイできるようになります。 人間のデモンストレーションは本質的に基準運動です。 彼らは、人間の中で最も多くの卓球を見てきたロボットを作り、それを使って独自のゲームを開発しています。 それでも勝った。(かろうじて。でもそれは長くは続かない)
Dvijの作品はこちらからご覧いただけます: そして、同行させてく@hananyssありがとうございます!
389