Ostatnio byłem trochę cichy na X. Miniony rok był transformującym doświadczeniem. Grok-4 i Kimi K2 są niesamowite, ale świat robotyki to cudowny dziki zachód. Czuję się jak w NLP w 2018 roku, kiedy opublikowano GPT-1, wraz z BERT i tysiącem innych kwiatów, które zakwitły. Nikt nie wiedział, który z nich ostatecznie stanie się ChatGPT. Debaty były gorące. Entropia była na najwyższym poziomie. Pomysły były niesamowicie zabawne. Wierzę, że GPT-1 robotyki jest już gdzieś na Arxiv, ale nie wiemy dokładnie, który to. Może to być modele świata, RL, uczenie się z ludzkich wideo, sim2real, real2sim itd., lub jakiekolwiek ich połączenie. Debaty są gorące. Entropia jest na najwyższym poziomie. Pomysły są niesamowicie zabawne, zamiast wyciskać ostatnie kilka % na AIME i GPQA. Natura robotyki znacznie komplikuje również przestrzeń projektową. W przeciwieństwie do czystego świata bitów dla LLM (ciągi tekstowe), my, robotycy, musimy radzić sobie z chaotycznym światem atomów. W końcu w pętli znajduje się kawałek zdefiniowanego programowo metalu. Normiki LLM mogą mieć trudności w uwierzeniu, ale jak dotąd robotycy wciąż nie mogą się zgodzić co do benchmarku! Różne roboty mają różne możliwości - niektóre są lepsze w akrobatyce, podczas gdy inne w manipulacji obiektami. Niektóre są przeznaczone do użytku przemysłowego, podczas gdy inne do zadań domowych. Cross-embodiment to nie tylko nowość badawcza, ale niezbędna cecha dla uniwersalnego mózgu robota. Rozmawiałem z dziesiątkami liderów C-suite z różnych firm robotycznych, starych i nowych. Niektórzy sprzedają całe ciała. Niektórzy sprzedają części ciała, takie jak zręczne ręce. Wiele innych sprzedaje łopaty do produkcji nowych ciał, tworzenia symulacji lub zbierania ogromnych zbiorów danych. Przestrzeń pomysłów biznesowych jest tak dzika jak sama badania. To nowa gorączka złota, jakiej nie widzieliśmy od fali ChatGPT w 2022 roku. Najlepszy czas na wejście to moment, gdy szczyty niezgody. Wciąż jesteśmy na początku krzywej strat - są silne oznaki życia, ale daleko, daleko od zbieżności. Każdy krok gradientowy prowadzi nas w nieznane. Ale jedno wiem na pewno - nie ma AGI bez dotykania, czucia i bycia ucieleśnionym w chaotycznym świecie. Na bardziej osobistą nutę - prowadzenie laboratorium badawczego wiąże się z zupełnie nowym poziomem odpowiedzialności. Informowanie bezpośrednio CEO firmy o wartości 4 bilionów dolarów jest, delikatnie mówiąc, zarówno ekscytujące, jak i całkowicie pochłaniające moją uwagę. Minęły czasy, kiedy mogłem być na bieżąco i zagłębiać się w każdą wiadomość AI. Postaram się znaleźć czas, aby podzielić się więcej moją podróżą.
876,96K