<Maintenant, ce n'est pas le modèle, mais les données qui sont compétitives> Le cœur de l'industrie de l'IA n'est plus le calcul ou les modèles, mais les 'données de haute qualité.' Tout comme la civilisation humaine a progressé grâce au pétrole dans le passé, l'IA a également besoin d'un nouveau 'carburant' pour avancer. Tout comme le pétrole a été utilisé comme source d'énergie et matière avant et après la Seconde Guerre mondiale, menant à une industrialisation rapide, la manière dont les données sont sécurisées et traitées déterminera le leadership à l'ère de l'IA. Elon Musk a également mentionné cela plus tôt cette année. "Nous avons épuisé la somme cumulative des connaissances humaines dans l'apprentissage de l'IA." Il est vrai que des modèles comme GPT ont rapidement progressé en grattant des données publiques provenant de sites web, de livres, de codes et d'images. Cependant, maintenant nous avons besoin de nouvelles formes de données qui sont soit protégées par des droits d'auteur, soit n'existent pas du tout. Par exemple, dans des domaines comme les véhicules autonomes et la robotique, nous avons besoin de données complexes basées sur l'intégration multi-capteurs, telles que des caméras, des radars et des lidars, ainsi que des données de cas collectées dans des environnements réels, qui n'existent pas sur le web. Le plus gros problème est 'comment bien les combiner' plutôt que la technologie elle-même. Des milliers de personnes doivent collecter, étiqueter et mettre à jour des données tout en étant dispersées, et les méthodes centralisées utilisées jusqu'à présent peinent à gérer cette diversité et cette échelle. Par conséquent, l'industrie de l'IA converge de plus en plus vers l'idée qu'une approche décentralisée est la solution. C'est là que 'Poseidon (@psdnai)' entre en jeu. Poseidon n'est pas seulement un entrepôt de données ; c'est une infrastructure qui reçoit, vérifie et affine les données du monde réel pour créer des ensembles de données d'entraînement qui peuvent être utilisés sans préoccupations de droits d'auteur. Pour le dire métaphoriquement, Poseidon est une 'raffinerie de pétrole.' Il prend des données brutes et les affine en carburant que l'IA peut utiliser pour apprendre. Tout ce processus fonctionne sur @StoryProtocol. Il enregistre de manière transparente sur la chaîne qui a fourni les données, dans quelles conditions, et qui les a utilisées. Ceux qui fournissent des données reçoivent une compensation équitable, et les développeurs d'IA peuvent les utiliser en toute tranquillité. Poseidon, qui réalisera l'innovation au niveau des données plutôt que par le biais de GPU ou de modèles, pourrait être le meilleur exemple d'application de la technologie web3 aux industries web2.
Chris Dixon
Chris Dixon23 juil., 00:18
Nous sommes ravis d'annoncer que nous menons un tour de financement de 15 millions de dollars dans Poseidon, qui a été incubé par @StoryProtocol et qui construit une couche de données décentralisée pour coordonner l'offre et la demande de données d'entraînement pour l'IA. La première génération de modèles fondamentaux d'IA a été formée sur des données qui semblaient être une ressource pratiquement illimitée. Aujourd'hui, les ressources les plus accessibles, telles que les livres et les sites web, ont principalement été épuisées, et les données sont devenues un facteur limitant dans les progrès de l'IA. Une grande partie des données qui restent maintenant est soit de qualité inférieure, soit inaccessible en raison des protections de propriété intellectuelle. Pour certaines des applications d'IA les plus prometteuses — dans la robotique, les véhicules autonomes et l'intelligence spatiale — les données n'existent même pas encore. Maintenant, ces systèmes ont besoin de types d'informations entièrement nouveaux : multi-sensorielles, riches en cas limites, capturées dans la nature. D'où viendra toutes ces données du monde physique ? Le défi n'est pas seulement technique — c'est un problème de coordination. Des milliers de contributeurs doivent travailler ensemble de manière distribuée pour sourcer, étiqueter et maintenir les données physiques dont l'IA de prochaine génération a besoin. Nous croyons qu'aucune approche centralisée ne peut orchestrer efficacement la création et la curation des données nécessaires au niveau d'échelle et de diversité requis. Une approche décentralisée peut résoudre cela. @psdnai permet aux fournisseurs de collecter les données dont les entreprises d'IA ont besoin, tout en garantissant la sécurité de la propriété intellectuelle via la licence IP programmable de Story. Cela vise à établir une nouvelle fondation économique pour Internet, où les créateurs de données sont justement rémunérés pour aider les entreprises d'IA à alimenter la prochaine génération de systèmes intelligents. L'équipe de Poseidon, dirigée par le scientifique en chef et cofondateur @SPChinchali, apporte une expertise approfondie en infrastructure d'IA. Sandeep est professeur à l'UT Austin spécialisé en IA, robotique et systèmes distribués, avec un doctorat de Stanford en IA et systèmes distribués. Le responsable produit et cofondateur @sarickshah a passé une décennie en tant qu'ingénieur en apprentissage automatique, développant des produits d'IA pour de grandes entreprises dans les services financiers, les télécommunications et la santé. Nous sommes ravis de soutenir Poseidon dans son travail pour résoudre l'un des goulets d'étranglement les plus critiques dans le développement de l'IA.
2,26K