<Agora não é o modelo, mas os dados que são competitivos> O núcleo da indústria de IA não é mais computação ou modelos, mas 'dados de alta qualidade'. Assim como a civilização humana avançou através do petróleo no passado, a IA também precisa de um novo "combustível" para avançar. Assim como o petróleo foi usado como fonte de energia e material antes e depois da Segunda Guerra Mundial, levando à rápida industrialização, a forma como os dados são protegidos e processados determinará a liderança na era da IA. Elon Musk também mencionou isso no início deste ano. "Esgotamos a soma cumulativa do conhecimento humano no aprendizado de IA." É verdade que modelos como o GPT cresceram rapidamente ao extrair dados públicos de sites, livros, códigos e imagens. No entanto, agora precisamos de novas formas de dados que sejam protegidos por direitos autorais ou não existam. Por exemplo, em campos como veículos autônomos e robótica, precisamos de dados complexos baseados na integração de vários sensores, como câmeras, radares e lidars, bem como dados de casos coletados em ambientes reais, que não existem na web. O maior problema é "como combiná-los bem", e não a tecnologia em si. Milhares de pessoas precisam coletar, rotular e atualizar dados enquanto estão dispersas, e os métodos centralizados usados até agora lutam para lidar com essa diversidade e escala. Portanto, a indústria de IA está cada vez mais convergindo para a ideia de que uma abordagem descentralizada é a solução. É aqui que 'Poseidon (@psdnai)' entra em jogo. O Poseidon não é apenas um data warehouse; É uma infraestrutura que recebe, verifica e refina dados do mundo real para criar conjuntos de dados de treinamento que podem ser usados sem preocupações com direitos autorais. Para colocar metaforicamente, Poseidon é uma 'refinaria de petróleo'. Ele pega dados brutos e os refina em combustível que a IA pode usar para aprender. Todo esse processo opera em @StoryProtocol. Ele registra de forma transparente na cadeia quem forneceu os dados, em que condições e quem os usou. Aqueles que fornecem dados recebem uma compensação justa e os desenvolvedores de IA podem usá-los com tranquilidade. O Poseidon, que alcançará inovação na camada de dados e não por meio de GPUs ou modelos, pode ser o melhor exemplo de aplicação da tecnologia web3 às indústrias web2.
Chris Dixon
Chris Dixon23 de jul., 00:18
Temos o prazer de anunciar que estamos liderando uma rodada inicial de US$ 15 milhões em Poseidon, que foi incubada pela @StoryProtocol e está construindo uma camada de dados descentralizada para coordenar a oferta e a demanda por dados de treinamento de IA. A primeira geração de modelos de base de IA foi treinada em dados que pareciam ser um recurso efetivamente ilimitado. Hoje, os recursos mais acessíveis, como livros e sites, estão esgotados e os dados se tornaram um fator limitante no progresso da IA. Muitos dos dados que restam agora são de qualidade inferior ou estão fora dos limites devido às proteções de IP. Para algumas das aplicações de IA mais promissoras – em robótica, veículos autônomos e inteligência espacial – os dados ainda nem existem. Agora, esses sistemas precisam de tipos de informação totalmente novos: multissensoriais, ricos em casos extremos, capturados na natureza. De onde virão todos esses dados do mundo físico? O desafio não é apenas técnico - é um problema de coordenação. Milhares de colaboradores devem trabalhar juntos de forma distribuída para obter, rotular e manter os dados físicos de que a IA de última geração precisa. Acreditamos que nenhuma abordagem centralizada pode orquestrar com eficiência a criação e a curadoria de dados necessárias no nível necessário de escala e diversidade. Uma abordagem descentralizada pode resolver isso. @psdnai permite que os fornecedores coletem os dados de que as empresas de IA precisam, garantindo a segurança da PI por meio da licença de PI programável da Story. Isso busca estabelecer uma nova base econômica para a internet, onde os criadores de dados são compensados de forma justa por ajudar as empresas de IA a alimentar a próxima geração de sistemas inteligentes. A equipe da Poseidon, liderada pelo cientista-chefe e cofundador @SPChinchali, traz profundo conhecimento em infraestrutura de IA. Sandeep é professor da UT Austin especializado em IA, robótica e sistemas distribuídos, com doutorado em Stanford em IA e sistemas distribuídos. Chefe de produto e cofundador, @sarickshah passou uma década como engenheiro de aprendizado de máquina, dimensionando produtos de IA para grandes empresas em serviços financeiros, telecomunicações e saúde. Estamos entusiasmados em apoiar a Poseidon em seu trabalho para resolver um dos gargalos mais críticos no desenvolvimento de IA.
1,92K