Todos têm perguntado sobre o momento "DeepSeek" da América. Ele chegou. 🇺🇸. Estamos incrivelmente entusiasmados em lançar o Cogito v2. É um dos modelos abertos mais fortes do mundo. Ele iguala/supera o desempenho dos mais recentes modelos DeepSeek v3 e DeepSeek R1, e se aproxima de modelos de fronteira fechada como o o3. Há 18 meses, era herético pensar que você poderia treinar um modelo OSS líder fora das organizações que tinham menos de dezenas de bilhões de dólares. Desde então, tem sido notável que os modelos OSS líderes estão todos saindo da China. Onde estão os modelos OSS líderes dos EUA? Hoje, isso muda. Muitas pessoas chamaram Drishan e Dhruv de loucos por aceitarem esse desafio. Essa foi a razão exata pela qual queríamos trabalhar com eles no @southpkcommons.
Desmarcar:
Drishan Arora
Drishan Arora1/08, 01:02
Hoje, estamos a lançar 4 modelos de raciocínio híbrido de tamanhos 70B, 109B MoE, 405B, 671B MoE sob licença aberta. Estes são alguns dos LLMs mais fortes do mundo e servem como prova de conceito para um novo paradigma de IA - autoaperfeiçoamento iterativo (sistemas de IA que se melhoram a si mesmos). O maior modelo de 671B MoE está entre os modelos abertos mais fortes do mundo. Ele iguala/excede o desempenho dos mais recentes modelos DeepSeek v3 e DeepSeek R1, e aproxima-se de modelos de fronteira fechada como o o3 e o Claude 4 Opus.
8,21K