He estado un poco callado en X recientemente. El último año ha sido una experiencia transformadora. Grok-4 y Kimi K2 son increíbles, pero el mundo de la robótica es un maravilloso salvaje oeste. Se siente como PNL en 2018 cuando se publicó GPT-1, junto con BERT y mil otras flores que florecieron. Nadie sabía cuál se convertiría finalmente en ChatGPT. Los debates fueron acalorados. La entropía estaba por las nubes. Las ideas eran increíblemente divertidas. Creo que el GPT-1 de la robótica ya está en algún lugar de Arxiv, pero no sabemos exactamente cuál. Podrían ser modelos de mundos, RL, aprendiendo de video humano, sim2real, real2sim, etc. etc, o cualquier combinación de ellos. Los debates son acalorados. La entropía está por las nubes. Las ideas son increíblemente divertidas, en lugar de exprimir el último porcentaje en AIME y GPQA. La naturaleza de la robótica también complica enormemente el espacio de diseño. A diferencia del mundo limpio de los bits para los LLM (cadenas de texto), los expertos en robótica tenemos que lidiar con el desordenado mundo de los átomos. Después de todo, hay un trozo de metal definido por software en el bucle. Puede que a los normies de LLM les cueste creerlo, pero hasta ahora los robotistas siguen sin ponerse de acuerdo en un punto de referencia. Los diferentes robots tienen diferentes envolventes de capacidad: algunos son mejores en acrobacias mientras que otros en la manipulación de objetos. Algunos están destinados para uso industrial, mientras que otros son para tareas domésticas. La encarnación cruzada no es solo una novedad en la investigación, sino una característica esencial para un cerebro robótico universal. He hablado con docenas de líderes de alto nivel de varias compañías de robots, antiguas y nuevas. Algunos venden todo el cuerpo. Algunos venden partes del cuerpo, como manos diestras. Muchos otros venden las palas para fabricar nuevos cuerpos, crear simulaciones o recopilar grandes cantidades de datos. El espacio de las ideas de negocio es tan salvaje como la propia investigación. Es una nueva fiebre del oro, como no hemos visto desde la ola de ChatGPT de 2022. El mejor momento para entrar es cuando la falta de consenso alcanza su punto máximo. Todavía estamos en el comienzo de una curva de pérdidas: hay fuertes señales de vida, pero muy, muy lejos de la convergencia. Cada paso de gradiente nos lleva a lo desconocido. Pero una cosa sí sé con certeza: no hay AGI sin tocar, sentir y ser encarnado en el mundo desordenado. En una nota más personal, dirigir un laboratorio de investigación conlleva un nuevo nivel de responsabilidad. Dar actualizaciones directamente al CEO de una empresa de 4 billones de dólares es, por decirlo suavemente, emocionante y absorbente para mis pesos de atención. Atrás quedaron los días en los que podía estar al tanto y profundizar en todas las noticias de IA. Trataré de sacar tiempo para compartir más de mi viaje.
876.95K