Tôi đã đến phòng thí nghiệm của @DvijKalaria tại @berkeley_ai và chơi bóng bàn với robot của anh ấy, Oreo. Tôi đã chơi rất nhiều bóng bàn khi còn nhỏ. Cảm giác này thật sự siêu thực và là một trong những khoảnh khắc "Tôi ước gì tôi có thể nói với bản thân hồi trung học về điều này". Bóng bàn là một trong những môn thể thao khó hơn cho robot chơi. Cú bóng có thể di chuyển với tốc độ lên đến 30+ mph với độ xoáy mạnh, ý định của đối thủ con người thì bị ẩn giấu, và toàn bộ cơ thể phải phối hợp. Oreo là một robot hình người hoàn chỉnh cầm một cái vợt thật, và nó đã học các động tác chính như cú đánh bằng cách quan sát Dvij trình diễn. Không có dữ liệu huấn luyện nào được thu thập bởi robot. Một người chỉ cho động tác, chính sách sẽ tổng quát hóa. Cách mà nó hoạt động, theo như tôi hiểu: - Một hệ thống thông minh (một kế hoạch phân cấp) đầu tiên xác định nơi quả bóng sẽ bay và chọn loại cú đánh tốt nhất, như cú đánh thuận tay hoặc trái tay. - Kế hoạch này sau đó giúp huấn luyện "bộ não" của robot (một chính sách RL) trong một mô phỏng ảo. Bộ não học hỏi qua thử nghiệm và sai lầm, nhận phần thưởng khi nó bắt chước một vài động tác ví dụ. - Khi đã được huấn luyện trong mô phỏng, toàn bộ thiết lập sẽ được áp dụng cho robot vật lý thực để nó có thể chơi thật. Các buổi trình diễn của con người về cơ bản là các động tác tham chiếu. Họ đang xây dựng một robot đã xem nhiều bóng bàn của con người hơn bất kỳ con người nào khác, và sử dụng điều đó để phát triển trò chơi của riêng nó. Tôi vẫn thắng. (Hơi chật vật. Nhưng điều đó sẽ không kéo dài.)
Theo dõi công việc của Dvij tại đây: Và cảm ơn @hananyss đã cho tôi đi cùng!
389