La prochaine frontière de l'IA n'est pas le calcul ou des modèles plus grands, mais de meilleures données. Aujourd'hui, nous accueillons l'une des rares personnes qui a réellement passé sa vie à résoudre ce problème. Bienvenue @SPChinchali, notre nouveau Directeur de l'IA. La frontière de l'IA n'est plus définie par des modèles avec plus de paramètres, ou des clusters de calcul avec plus de GPU. Elle sera définie par la rareté de données de haute intégrité, autorisées par la propriété intellectuelle, provenant du monde physique (pensez à la robotique, au matériel autonome et aux dispositifs en périphérie). Sandeep a passé sa carrière à poursuivre cette frontière. Maintenant, il nous aide à la débloquer. Lorsque j'ai rencontré Sandeep pour la première fois, j'ai été frappé par son attitude douce et attachante. Il a une façon de parler qui vous attire, que ce soit pour expliquer l'IA neurosymbolique ou pour louer le clavier ergonomique au look extraterrestre qu'il emporte partout avec lui. Son parcours parle de lui-même : doctorat de Stanford, NASA JPL. Maintenant professeur à l'UT Austin, dirigeant des recherches à l'intersection de l'apprentissage automatique décentralisé et de la robotique, Sandeep est obsédé par la manière d'obtenir des données utiles pour l'entraînement de l'IA afin de les rendre utiles dans le monde réel : > créer des incitations à la donnée pour les réseaux distribués, > s'attaquer au problème classique de l'échantillonnage à longue traîne dans la robotique en périphérie, et > concevoir des systèmes qui préservent la provenance. Sandeep a également confirmé une thèse qui m'obsède depuis des années : le véritable rempart, c'est les données. Pas des forums Reddit grattés ou des textes web génériques, mais des données réelles, attribuables et autorisées. Les données désordonnées et imprévisibles nécessaires pour rendre les systèmes physiques robustes ne peuvent pas être simulées. Il s'agit de sourcer et de curer les données désordonnées et à longue traîne que les systèmes physiques rencontrent dans la nature : le robot de chargement glissant à 2h du matin, la micro-fissure à peine visible sur une pale d'éolienne, le cas particulier qu'une unité lidar n'a jamais vu auparavant. Ces moments sont de la propriété intellectuelle, et ils sont précieux. Si nous pouvons rendre cette propriété intellectuelle programmable, licenciable, traçable et monétisable en temps réel, nous débloquons un flywheel pour chaque équipe d'IA sur la planète. La propriété intellectuelle programmable est le seul socle qui rend cela possible. La plupart des tentatives de crypto x IA ajoutent "IA" à l'infrastructure existante. Sandeep nous rejoint parce que Story est construit de manière à résoudre ces types de défis de coordination des données. Story est conçu pour des relations dynamiques et composables. Notre protocole est conçu pour la provenance basée sur des graphes, le licensing dynamique et les flux de redevances automatisés que les systèmes d'IA modernes exigent. Une photo peut être licenciée, une étiquette peut être ajoutée, une variation synthétique peut être générée, et sur Story, chaque action devient un nouvel actif de propriété intellectuelle lié dans un graphe transparent, avec de la valeur qui revient à chaque contributeur. L'arrivée de Sandeep est un tournant. Le chapitre 2 de Story commence à se dessiner, et la prochaine phase de l'infrastructure de l'IA ne fait que commencer. Sa combinaison d'intellect profond, de curiosité sincère et de dévouement silencieux est exactement ce que ce moment exige. Nous ne pourrions pas être plus excités de construire l'avenir de l'IA avec lui, et il y a encore beaucoup plus à venir. Restez à l'écoute !
Sandeep Chinchali
Sandeep Chinchali17 juil., 23:00
J'ai passé ma carrière à poursuivre une question : Comment rassembler les bonnes données pour faire fonctionner l'IA dans le monde réel ? Des laboratoires de Stanford aux salles de classe de l'UT Austin, j'ai cherché partout. La réponse n'est pas un autre laboratoire d'IA, mais une blockchain conçue pour traiter les données comme de la propriété intellectuelle. C'est pourquoi je rejoins @StoryProtocol en tant que Chief AI Officer. À Stanford, j'ai étudié la "robotique en nuage", comment des flottes de robots pouvaient utiliser le calcul distribué pour apprendre ensemble. J'ai même monté une caméra de tableau de bord dans ma voiture pour résoudre cela : Si les robots ne pouvaient télécharger que 5 à 10 % de ce qu'ils voient, comment choisissons-nous les données les plus précieuses ? La plupart était des images ennuyeuses d'autoroute. Mais <1 % capturait des scènes rares : des Waymos autonomes, des chantiers de construction, des humains imprévisibles. Ces données "longue traîne" rendaient les modèles plus intelligents. Je les ai étiquetées à la main, j'ai même payé le service d'étiquetage de Google Cloud pour annoter mes images avec des concepts de niche comme "unité LIDAR" et "véhicule autonome", et j'ai entraîné des modèles qui fonctionnaient sur un TPU de la taille d'une clé USB. Mais le monde académique a ses limites. À l'UT Austin, mes questions ont évolué : → Comment crowdsourcer des données rares pour améliorer le ML ? → Quels systèmes d'incitation fonctionnent réellement ? Cela m'a attiré vers la crypto – blockchains, économies de jetons, même DePIN. J'ai blogué, écrit des articles sur le ML décentralisé, mais je me demandais toujours : qui construit réellement cette infrastructure ? Par pur hasard, j'ai rencontré l'équipe de Story. J'ai été invité à donner une conférence dans leurs bureaux de Palo Alto. Il était 18h, la salle était encore pleine. J'ai divagué sur "l'IA neuro-symbolique" et j'ai terminé avec une diapositive intitulée "Une pincée de crypto". Cette conférence s'est transformée en un rôle de conseiller, qui est maintenant devenu quelque chose de bien plus grand. Nous sommes à un moment décisif. Le calcul est principalement résolu. Les architectures de modèles sont copiées du jour au lendemain. La véritable barrière est les données. Pas Reddit gratté. Pas un langage sans fin. Mais des données réelles, à longue traîne et avec droits clairs, qui entraînent l'IA incarnée – robots, AV, systèmes qui naviguent dans notre monde chaotique. Imaginez ceci : je capture une scène de conduite rare sur une caméra de tableau de bord et je l'enregistre sur Story. Un ami l'étiquette. Un agent IA crée des variantes synthétiques. Sur la chaîne structurée en graphe de Story, chacune devient une propriété intellectuelle liée. Les redevances reviennent automatiquement. Tout le monde est payé, chaque étape est traçable sur la chaîne. C'est pourquoi je suis maintenant Chief AI Officer chez Story, construisant les rails pour des données d'entraînement décentralisées et clarifiées en matière de propriété intellectuelle. Il est temps de faire des données la nouvelle propriété intellectuelle. Story est l'endroit pour le faire. Beaucoup plus à venir bientôt. Allons-y.
feedsImage
6,92K