En ny 30 minuter lång presentation från @aelluswamy, Teslas VP of AI, har släppts, där han pratar om FSD, AI och teamets senaste framsteg. Höjdpunkt från presentationen: • Teslas fordonsflotta kan tillhandahålla 500 år av kördata varje dag. Dimensionalitetens förbannelse: • 8 kameror med hög bildfrekvens = miljarder tokens per 30 sekunders körkontext. • Tesla måste komprimera och extrahera de rätta korrelationerna mellan sensorisk input och kontrollåtgärder. Fördel med data: • Tesla har tillgång till ett "Niagarafallen av data" – hundratals års kollektiv körning i fordonsflottor. • Använder smarta datautlösare för att fånga sällsynta hörnfall (t.ex. komplexa korsningar, oförutsägbart beteende). Kvalitet och effektivitet: • Extraherar endast de viktiga data som behövs för att träna modeller effektivt. Felsökning och tolkning: • Även om systemet är end-to-end kan Tesla fortfarande uppmana modellen att mata ut tolkningsbara data: 3D-beläggning, väggränser, objekt, skyltar, trafikljus etc. • Frågor på naturligt språk: fråga modellen varför den fattade ett visst beslut. • Dessa hjälpförutsägelser driver inte bilen men hjälper ingenjörer att felsöka och garantera säkerheten. Teslas avancerade Gaussiska splatting (3D-scenmodellering): • Tesla utvecklade ett anpassat, ultrasnabbt Gaussiskt splatting-system för att rekonstruera 3D-scener från begränsade kameravyer. • Ger skarpa, exakta 3D-renderingar även från få kameravinklar – mycket bättre än vanliga NeRF/splatting-metoder. • Möjliggör snabb visuell felsökning av körmiljön i 3D. Utvärdering och Världsmodeller: • Utvärdering är den svåraste utmaningen: modeller kan prestera bra offline men misslyckas under verkliga förhållanden. • Tesla bygger balanserade, mångsidiga utvärderingsdatauppsättningar med fokus på gränsfall – inte bara enkel motorvägskörning....