Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
NVIDIA Directeur van Robotica & Vooraanstaand Wetenschapper. Co-leider van het GEAR-lab. Fysieke AGI oplossen, één motor tegelijk. Stanford Ph.D. OpenAI's 1e stagiair.
Ik observeer een mini Moravec-paradox binnen de robotica: gymnastiek die moeilijk is voor mensen, is veel gemakkelijker voor robots dan "onsexy" taken zoals koken, schoonmaken en assembleren. Het leidt tot een cognitieve dissonantie voor mensen buiten het vakgebied: "dus, robots kunnen parkour en breakdance, maar waarom kunnen ze niet voor mijn hond zorgen?" Geloof me, mijn ouders hebben me hier vaker naar gevraagd dan je denkt ...
De "Robot Moravec-paradox" creëert ook de illusie dat fysieke AI-capaciteiten veel geavanceerder zijn dan ze werkelijk zijn. Ik wijs Unitree niet specifiek aan, want dit geldt breed voor alle recente acrobatische demonstraties in de industrie. Hier is een eenvoudige test: als je een muur voor de zij-flippende robot plaatst, zal hij met volle kracht tegen de muur botsen en een spektakel maken. Omdat hij gewoon die enkele referentiemotion overfit, zonder enige bewustzijn van de omgeving.
Hier is waarom de paradox bestaat: het is veel gemakkelijker om een "blinde gymnast" te trainen dan een robot die ziet en manipuleert. De eerste kan volledig in simulatie worden opgelost en zonder enige aanpassing naar de echte wereld worden overgebracht, terwijl de laatste extreem realistische rendering, contactfysica en rommelige dynamiek van objecten in de echte wereld vereist - niets hiervan kan goed worden gesimuleerd.
Stel je voor dat je LLM's kunt trainen, niet van het internet, maar van een puur handgemaakt tekstconsole-spel. Robotica-ingenieurs hebben geluk gehad. We leven toevallig in een wereld waar versnelde fysica-engines zo goed zijn dat we indrukwekkende acrobatiek kunnen uitvoeren met letterlijk nul echte data. Maar we hebben nog niet dezelfde cheatcode ontdekt voor algemene behendigheid.
Tot die tijd zullen we nog steeds vragen krijgen van onze verwarde ouders.
351,64K
Mijn norm voor AGI is veel eenvoudiger: een AI die een heerlijk diner kookt in iemands huis voor elke keuken. De Fysieke Turing Test is zeer waarschijnlijk moeilijker dan de Nobelprijs. Moravec's paradox zal ons blijven achtervolgen, steeds groter en duisterer, in het komende decennium.

Thomas Wolf19 jul, 16:06
Mijn norm voor AGI is een AI die een Nobelprijs wint voor een nieuwe theorie die het zelf heeft ontwikkeld.
99,08K
Ik ben de laatste tijd een beetje stil op X geweest. Het afgelopen jaar is een transformerende ervaring geweest. Grok-4 en Kimi K2 zijn geweldig, maar de wereld van robotica is een wonderlijke wildernis. Het voelt als NLP in 2018 toen GPT-1 werd gepubliceerd, samen met BERT en duizend andere bloemen die bloeiden. Niemand wist welke uiteindelijk ChatGPT zou worden. De debatten waren verhittend. De entropie was torenhoog. Ideeën waren waanzinnig leuk.
Ik geloof dat de GPT-1 van robotica al ergens op Arxiv staat, maar we weten niet precies welke. Het zou wereldmodellen, RL, leren van menselijke video, sim2real, real2sim, enz. enz. kunnen zijn, of een combinatie daarvan. De debatten zijn verhittend. De entropie is torenhoog. Ideeën zijn waanzinnig leuk, in plaats van de laatste paar % uit AIME & GPQA te persen.
De aard van robotica compliceert ook de ontwerpruimte enorm. In tegenstelling tot de schone wereld van bits voor LLM's (tekststrings), moeten wij robotica-experts omgaan met de rommelige wereld van atomen. Tenslotte is er een stuk software-gedefinieerd metaal in de lus. LLM-normies zullen het moeilijk vinden om te geloven, maar tot nu toe kunnen robotica-experts het nog steeds niet eens worden over een benchmark! Verschillende robots hebben verschillende capaciteitsomslagen - sommige zijn beter in acrobatiek terwijl anderen beter zijn in objectmanipulatie. Sommige zijn bedoeld voor industrieel gebruik terwijl anderen voor huishoudelijke taken zijn. Cross-embodiment is niet alleen een onderzoeksnoviteit, maar een essentiële functie voor een universele robotbrein.
Ik heb met tientallen C-suite leiders van verschillende robotbedrijven gesproken, oud en nieuw. Sommigen verkopen het hele lichaam. Sommigen verkopen lichaamsdelen zoals behendige handen. Veel anderen verkopen de scheppen om nieuwe lichamen te vervaardigen, simulaties te creëren of enorme hoeveelheden gegevens te verzamelen. De zakelijke ideeënruimte is net zo wild als het onderzoek zelf. Het is een nieuwe goudkoorts, zoals we die sinds de ChatGPT-golf van 2022 niet meer hebben gezien.
De beste tijd om in te stappen is wanneer de non-consensus piekt. We bevinden ons nog steeds aan het begin van een verliescurve - er zijn sterke tekenen van leven, maar nog ver, ver weg van convergentie. Elke gradientstap brengt ons in het onbekende. Maar één ding weet ik zeker - er is geen AGI zonder aanraken, voelen en belichaamd zijn in de rommelige wereld.
Op een meer persoonlijk niveau - het runnen van een onderzoekscentrum komt met een geheel nieuw niveau van verantwoordelijkheid. Direct updates geven aan de CEO van een bedrijf van $4T is, om het mild uit te drukken, zowel opwindend als volledig al mijn aandacht opslokkend. De dagen zijn voorbij dat ik alles kon bijhouden en diep in elk AI-nieuws kon duiken.
Ik zal proberen tijd vrij te maken om meer van mijn reis te delen.

876,98K
De fysieke Turing-test: je huis is een complete puinhoop na een zondagse hackathon. Op maandagavond kom je thuis in een smetteloze woonkamer en een diner bij kaarslicht. En je kon niet zeggen of er een mens of een machine was geweest. Bedrieglijk eenvoudig, waanzinnig moeilijk.
Het is de volgende Poolster van AI. De droom die me om 12 uur 's ochtends wakker houdt in het lab. De visie voor het volgende computerplatform dat brokken atomen automatiseert in plaats van brokken bits.
Bedankt Sequoia voor het hosten van mij bij AI Ascent! Hieronder vindt u mijn volledige lezing over de eerste principes om robotica voor algemeen gebruik op te lossen: hoe we denken over de datastrategie en schaalwetten. Ik verzeker je dat het 17 minuten zal zijn waar je geen spijt van krijgt!
107,23K
Op een dag in het komende decennium zullen we robots hebben in elk huis, elk ziekenhuis en elke fabriek, die elk saai en gevaarlijk werk met bovenmenselijke behendigheid doen. Die dag zal bekend staan als "donderdag". Zelfs Turing zou ons leven niet durven dromen in zijn stoutste dromen.

signüll21 apr 2025
We slaagden over de Turing-test en het kon niemand iets schelen. Geen parades. Geen koppen op de voorpagina. rechtvaardig... Een nonchalant schouderophalen. Zoals "Oh ja, de machines zijn slim genoeg om ons nu voor de gek te houden. Hoe dan ook, wat eten we voor de lunch?"
Die stilte vertelt je alles over het tempo waarin we ons voortbewegen.
Terug in mijn CS-lessen werd de Turing-test behandeld als de eindbaas. Nu is elke doorbraak weer een verdomde dinsdag.
101,98K
de humanoïde Olympische Spelen in 2030 zullen een waar spektakel zijn

Jim Fan5 feb 2025
We hebben humanoïde robots gekoppeld aan Cristiano Ronaldo, LeBron James en Kobe Bryant! Dit zijn neurale netwerken die draaien op echte hardware in ons GEAR-lab. De meeste robotdemonstraties die je online ziet, versnellen video's. Wij *vertragen ze* zodat je kunt genieten van de vloeiende bewegingen.
Ik ben enthousiast om "ASAP" aan te kondigen, een "real2sim2real" model dat extreem soepele en dynamische bewegingen voor volledige lichaamscontrole van humanoïden beheerst.
We trainen de robot eerst in simulatie, maar er is een beruchte "sim2real" kloof: het is erg moeilijk voor hand-geconfigureerde fysica-vergelijkingen om overeen te komen met de dynamiek van de echte wereld.
Onze oplossing is eenvoudig: implementeer gewoon een voorgetrainde policy op echte hardware, verzamel gegevens en speel de beweging in de simulatie opnieuw af. De herhaling zal uiteraard veel fouten bevatten, maar dat geeft een rijke signalen om de fysica-afwijking te compenseren. Gebruik een ander neuraal netwerk om de delta te leren. In wezen "repareren" we een traditionele fysica-engine, zodat de robot bijna de echte wereld op schaal kan ervaren in GPU's.
De toekomst is hybride simulatie: combineer de kracht van klassieke simulatie-engines die door de jaren heen zijn verfijnd met het ongewone vermogen van moderne neurale netwerken om een rommelige wereld vast te leggen.
45,86K
We hebben humanoïde robots gekoppeld aan Cristiano Ronaldo, LeBron James en Kobe Bryant! Dit zijn neurale netwerken die draaien op echte hardware in ons GEAR-lab. De meeste robotdemonstraties die je online ziet, versnellen video's. Wij *vertragen ze* zodat je kunt genieten van de vloeiende bewegingen.
Ik ben enthousiast om "ASAP" aan te kondigen, een "real2sim2real" model dat extreem soepele en dynamische bewegingen voor volledige lichaamscontrole van humanoïden beheerst.
We trainen de robot eerst in simulatie, maar er is een beruchte "sim2real" kloof: het is erg moeilijk voor hand-geconfigureerde fysica-vergelijkingen om overeen te komen met de dynamiek van de echte wereld.
Onze oplossing is eenvoudig: implementeer gewoon een voorgetrainde policy op echte hardware, verzamel gegevens en speel de beweging in de simulatie opnieuw af. De herhaling zal uiteraard veel fouten bevatten, maar dat geeft een rijke signalen om de fysica-afwijking te compenseren. Gebruik een ander neuraal netwerk om de delta te leren. In wezen "repareren" we een traditionele fysica-engine, zodat de robot bijna de echte wereld op schaal kan ervaren in GPU's.
De toekomst is hybride simulatie: combineer de kracht van klassieke simulatie-engines die door de jaren heen zijn verfijnd met het ongewone vermogen van moderne neurale netwerken om een rommelige wereld vast te leggen.
543,16K
Dat er een *tweede* paper is verschenen met tonnen RL flywheel geheimen en *multimodale* o1-stijl redenering staat vandaag niet op mijn bingo kaart. De papers van Kimi (een andere startup) en DeepSeek kwamen opmerkelijk overeen in vergelijkbare bevindingen:
> Geen behoefte aan complexe boomzoekmethoden zoals MCTS. Lineariseer gewoon de gedachtegang en doe goede oude autoregressieve voorspelling;
> Geen behoefte aan waarde functies die een andere dure kopie van het model vereisen;
> Geen behoefte aan dichte beloningsmodellering. Vertrouw zoveel mogelijk op de grondwaarheid, eindresultaat.
Verschillen:
> DeepSeek hanteert de AlphaZero-aanpak - puur bootstrap via RL zonder menselijke input, d.w.z. "cold start". Kimi hanteert de AlphaGo-Master-aanpak: lichte SFT om op te warmen via prompt-geengineerde CoT-sporen.
> DeepSeek-gewichten zijn MIT-licentie (thought leadership!); Kimi heeft nog geen modelrelease.
> Kimi toont sterke multimodale prestaties (!) op benchmarks zoals MathVista, wat visueel begrip van geometrie, IQ-tests, enz. vereist.
> De Kimi-paper bevat VEEL meer details over het systeemontwerp: RL-infrastructuur, hybride cluster, code-sandbox, parallelisme-strategieën; en leerdetails: lange context, CoT-compressie, curriculum, samplingstrategie, testgevalgeneratie, enz.
Opbeurende lectuur op een feestdag!

300,47K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste