Następną granicą AI nie są obliczenia ani większe modele, lecz lepsze dane. Dziś przyjmujemy jednego z nielicznych ludzi, którzy naprawdę poświęcili swoje życie na rozwiązanie tego problemu. Witamy @SPChinchali, naszego nowego Dyrektora ds. AI. Granica AI nie jest już definiowana przez modele z większą liczbą parametrów ani klastry obliczeniowe z większą liczbą GPU. Będzie definiowana przez niedobór danych o wysokiej integralności, z oczyszczonymi prawami własności z fizycznego świata (myśl o robotyce, autonomicznym sprzęcie i urządzeniach brzegowych). Sandeep spędził swoją karierę, goniąc tę granicę. Teraz pomaga nam ją odblokować. Kiedy po raz pierwszy spotkałem Sandeepa, uderzyło mnie jego łagodne, ujmujące usposobienie. Ma sposób mówienia, który przyciąga cię, niezależnie od tego, czy wyjaśnia AI neurosymboliczne, czy chwali ergonomiczna klawiaturę, która wygląda jak z obcej planety i którą nosi wszędzie ze sobą. Jego doświadczenie mówi samo za siebie: doktorat na Stanfordzie, NASA JPL. Teraz profesor na UT Austin, prowadzi badania na styku zdecentralizowanego ML i robotyki. Sandeep obsesyjnie myśli o tym, jak zdobyć użyteczne dane do treningu AI, aby uczynić je użytecznymi w rzeczywistym świecie: > tworzenie zachęt do danych dla rozproszonych sieci, > zajmowanie się klasycznym problemem próbkowania długiego ogona w robotyce brzegowej, oraz > projektowanie systemów, które zachowują pochodzenie. Sandeep potwierdził również tezę, którą obsesyjnie myślę od lat: prawdziwą fortecą są dane. Nie zeskrobane fora Reddita ani ogólny tekst z sieci, ale przypisane, oczyszczone z praw, dane ze świata rzeczywistego. Chaotyczne, nieprzewidywalne dane wymagane do uczynienia systemów fizycznych odpornymi nie mogą być symulowane. To pozyskiwanie i kuracja chaotycznych, długoterminowych danych, które systemy fizyczne widzą w terenie: śliski robot załadunkowy o 2 w nocy, ledwie widoczna mikro-pęknięcie na łopacie turbiny wiatrowej, przypadek, którego jednostka lidarowa nigdy wcześniej nie widziała. Te momenty to IP, i są cenne. Jeśli możemy uczynić to IP programowalnym, licencjonowalnym, śledzonym i monetyzowalnym w czasie rzeczywistym, odblokowujemy koło zamachowe dla każdego zespołu AI na świecie. Programowalne IP to jedyna podstawa, która to umożliwia. Większość prób łączenia kryptowalut z AI przyczepia "AI" do istniejącej infrastruktury. Sandeep dołącza, ponieważ Story jest zbudowane od podstaw, aby rozwiązać te rodzaje wyzwań związanych z koordynacją danych. Story jest zbudowane dla dynamicznych, kompozytowych relacji. Nasz protokół jest zaprojektowany dla opartego na grafie pochodzenia, dynamicznego licencjonowania i zautomatyzowanych przepływów tantiem, które nowoczesne systemy AI wymagają. Zdjęcie może być licencjonowane, etykieta może być dodana, syntetyczna wariacja może być generowana, a na Story każda akcja staje się nowym, powiązanym aktywem IP w przejrzystym grafie, z wartością wracającą do każdego współtwórcy. Przybycie Sandeepa to punkt zwrotny. Rozdział 2 Story zaczyna nabierać kształtów, a następna faza infrastruktury AI dopiero się zaczyna. Jego połączenie głębokiej inteligencji, szczerej ciekawości i cichej dedykacji jest dokładnie tym, czego wymaga ten moment. Nie mogliśmy być bardziej podekscytowani budowaniem przyszłości AI z nim, a to dopiero początek.
Sandeep Chinchali
Sandeep Chinchali17 lip, 23:00
Spędziłem swoją karierę, zadając sobie jedno pytanie: Jak zbierać odpowiednie dane, aby AI działało w rzeczywistym świecie? Od laboratoriów Stanforda po klasy na UT Austin, szukałem wszędzie. Odpowiedzią nie jest kolejne laboratorium AI, ale blockchain stworzony, aby traktować dane jako własność intelektualną. Dlatego dołączam do @StoryProtocol jako ich Chief AI Officer. Na Stanfordzie studiowałem "robotykę w chmurze", jak floty robotów mogłyby używać rozproszonego obliczania, aby uczyć się razem. Nawet zamontowałem kamerę samochodową, aby rozwiązać ten problem: Jeśli roboty mogłyby przesyłać tylko 5–10% tego, co widzą, jak wybieramy najcenniejsze dane? Większość z nich to były nudne nagrania z autostrady. Ale <1% uchwyciło rzadkie sceny: autonomiczne Waymos, place budowy, nieprzewidywalni ludzie. Te dane z "długiego ogona" uczyniły modele mądrzejszymi. Oznaczyłem je ręcznie, nawet zapłaciłem usłudze etykietowania Google Cloud, aby oznaczyć moje nagrania niszowymi pojęciami, takimi jak "jednostka LIDAR" i "pojazd autonomiczny", i trenowałem modele, które działały na TPU wielkości USB. Ale akademia ma swoje ograniczenia. Na UT Austin moje pytania się zmieniły: → Jak możemy crowdsourcingować rzadkie dane, aby poprawić ML? → Jakie systemy zachęt naprawdę działają? To wciągnęło mnie w kryptowaluty – blockchainy, gospodarki tokenowe, nawet DePIN. Prowadziłem bloga, pisałem artykuły na temat zdecentralizowanego ML, ale wciąż się zastanawiałem: kto tak naprawdę buduje tę infrastrukturę? Przez zupełny przypadek spotkałem zespół Story. Zostałem zaproszony do wygłoszenia wykładu w ich biurze w Palo Alto. Była 18:00, sala wciąż pełna. Mówiłem o "Neuro-Symbolic AI" i zakończyłem slajdem zatytułowanym "Szczypta kryptowalut". Ten wykład przerodził się w rolę doradczą, która teraz przekształciła się w coś znacznie większego. Jesteśmy w kluczowym momencie. Obliczenia są w większości rozwiązane. Architektury modeli są kopiowane z dnia na dzień. Prawdziwą fortecą są dane. Nie zeskrobane Reddit. Nie nieskończony język. Ale dane z prawami autorskimi, z długiego ogona, z rzeczywistego świata, które trenują uosobioną AI – roboty, AV, systemy, które nawigują w naszym chaotycznym świecie. Wyobraź sobie to: rejestruję rzadką scenę jazdy na kamerze samochodowej i rejestruję ją w Story. Przyjaciel ją etykietuje. Agent AI tworzy syntetyczne warianty. Na grafowej strukturze łańcucha Story, każdy staje się powiązanym IP. Royalty automatycznie wracają. Wszyscy dostają zapłatę, każdy krok jest śledzony na łańcuchu. Dlatego teraz jestem Chief AI Officer w Story, budującym tory dla zdecentralizowanych, oczyszczonych z praw autorskich danych treningowych. Czas, aby dane stały się nową własnością intelektualną. Story to miejsce, aby to zrobić. Wkrótce więcej informacji. Zaczynajmy.
feedsImage
6,27K