Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Foi ao laboratório do @DvijKalaria @berkeley_ai e jogou pingue-pongue contra o robô dele, Oreo. Eu jogava muito pingue-pongue quando criança. Isso pareceu apropriadamente surreal e um daqueles momentos de "queria poder contar isso para meu eu do ensino médio".
Tênis de mesa é um dos esportes mais difíceis para robôs jogarem. A bola pode se mover a até 30+ mph com um efeito forte, a intenção do oponente humano fica oculta e o corpo inteiro precisa coordenar. Oreo é um humanoide completo segurando uma raquete de verdade, e aprendeu movimentos importantes como balanços assistindo a demonstração do Dvij. Nenhum dado de treinamento coletado por robôs. Uma pessoa apresenta a moção, a política se generaliza.
O jeito que funciona, como eu entendi:
- Um sistema inteligente (um planejador hierárquico) primeiro determina para onde a bola vai voar e escolhe o melhor tipo de tacada, como um golpe de direita ou de backhand.
- Esse plano então ajuda a treinar o "cérebro" do robô (uma política de RL) em uma simulação virtual. O cérebro aprende por tentativa e erro, recebendo recompensas ao imitar alguns movimentos de exemplo
- Uma vez treinado no simulador, toda a configuração é aplicada ao robô físico real para que ele possa jogar de verdade.
As demonstrações humanas são essencialmente os movimentos de referência.
Eles estão construindo um robô que assistiu mais tênis de mesa humano do que qualquer humano, e usa isso para desenvolver seu próprio jogo.
Eu ainda ganhei. (Quase nada. Mas isso não vai durar)
Acompanhe o trabalho de Dvij aqui:
E obrigado @hananyss por me deixar acompanhar!
346
Melhores
Classificação
Favoritos
