Nowa 30-minutowa prezentacja od @aelluswamy, wiceprezesa Tesli ds. AI, została opublikowana, w której mówi o FSD, AI i najnowszych postępach zespołu. Najważniejsze punkty z prezentacji: • Flota pojazdów Tesli może dostarczać 500 lat danych o jeździe każdego dnia. Klątwa wymiarowości: • 8 kamer w wysokiej częstotliwości = miliardy tokenów na 30 sekund kontekstu jazdy. • Tesla musi kompresować i wydobywać odpowiednie korelacje między danymi sensorycznymi a działaniami kontrolnymi. Zaleta danych: • Tesla ma dostęp do "Wodospadu Niagary danych" — setek lat zbiorczych danych o jeździe floty. • Wykorzystuje inteligentne wyzwalacze danych do uchwycenia rzadkich przypadków (np. złożone skrzyżowania, nieprzewidywalne zachowanie). Jakość i wydajność: • Wydobywa tylko niezbędne dane potrzebne do efektywnego trenowania modeli. Debugowanie i interpretowalność: • Mimo że system jest end-to-end, Tesla nadal może nakłonić model do wyjścia z interpretowalnymi danymi: 3D zajętość, granice dróg, obiekty, znaki, sygnalizacja świetlna itp. • Zapytania w naturalnym języku: zapytaj model, dlaczego podjął określoną decyzję. • Te dodatkowe prognozy nie prowadzą samochodu, ale pomagają inżynierom w debugowaniu i zapewnieniu bezpieczeństwa. Zaawansowane Gaussian Splatting Tesli (Modelowanie scen 3D): • Tesla opracowała niestandardowy, ultra-szybki system Gaussian splatting do rekonstrukcji scen 3D z ograniczonych widoków kamer. • Produkuje wyraźne, dokładne renderingi 3D nawet z kilku kątów kamery — znacznie lepsze niż standardowe podejścia NeRF/splatting. • Umożliwia szybkie wizualne debugowanie środowiska jazdy w 3D. Ocena i modele świata: • Ocena to najtrudniejsze wyzwanie: modele mogą dobrze działać offline, ale zawodzić w warunkach rzeczywistych. • Tesla buduje zrównoważone, różnorodne zbiory danych do oceny, koncentrując się na przypadkach brzegowych — nie tylko na łatwej jeździe po autostradzie....