Я немного молчал в X в последнее время. Прошлый год стал трансформационным опытом. Grok-4 и Kimi K2 потрясающие, но мир робототехники — это удивительный дикий запад. Это похоже на NLP в 2018 году, когда был опубликован GPT-1, вместе с BERT и тысячами других цветов, которые расцвели. Никто не знал, какой из них в конечном итоге станет ChatGPT. Дебаты были горячими. Энтропия была на высоте. Идеи были безумно интересными. Я верю, что GPT-1 в робототехнике уже где-то на Arxiv, но мы не знаем точно, какой именно. Это могут быть мировые модели, RL, обучение на видео с участием человека, sim2real, real2sim и т.д., или любая их комбинация. Дебаты горячие. Энтропия на высоте. Идеи безумно интересные, вместо того чтобы выжимать последние несколько процентов на AIME и GPQA. Природа робототехники также значительно усложняет пространство дизайна. В отличие от чистого мира битов для LLM (строки текста), мы, робототехники, должны иметь дело с грязным миром атомов. В конце концов, в процессе есть кусок программного обеспечения, определяющего металл. Нормальные пользователи LLM могут с трудом в это поверить, но до сих пор робототехники не могут согласовать стандарт! Разные роботы имеют разные возможности — некоторые лучше в акробатике, в то время как другие — в манипуляции с объектами. Некоторые предназначены для промышленного использования, в то время как другие — для домашних задач. Кросс-объектность — это не просто исследовательская новинка, а важная особенность для универсального мозга робота. Я говорил с десятками руководителей C-suite из различных робототехнических компаний, как старых, так и новых. Некоторые продают целое тело. Некоторые продают части тела, такие как ловкие руки. Многие другие продают лопаты для производства новых тел, создания симуляций или сбора огромных объемов данных. Идеи бизнеса так же дики, как и само исследование. Это новая золотая лихорадка, подобной которой мы не видели с волны ChatGPT 2022 года. Лучшее время для входа — это когда пик несогласия. Мы все еще на начале кривой потерь — есть сильные признаки жизни, но мы далеки от сходимости. Каждый шаг градиента ведет нас в неизвестность. Но одно я знаю точно — нет AGI без прикосновения, ощущения и воплощения в грязном мире. На более личной ноте — управление исследовательской лабораторией связано с совершенно новым уровнем ответственности. Давать обновления напрямую CEO компании стоимостью $4 трлн — это, мягко говоря, и захватывающе, и полностью поглощает мое внимание. Ушли те дни, когда я мог быть в курсе и углубляться в каждую новость AI. Я постараюсь выделить время, чтобы поделиться больше своей историей.
876,95K