Все спрашивают о "DeepSeek" моменте Америки. Он настал. 🇺🇸. Мы невероятно рады представить Cogito v2. Это одна из самых мощных открытых моделей в мире. Она соответствует/превышает производительность последних моделей DeepSeek v3 и DeepSeek R1 и приближается к закрытым фронтовым моделям, таким как o3. 18 месяцев назад было еретическим думать, что можно обучить ведущую OSS модель вне организаций, у которых было бы менее 10 миллиардов долларов. С тех пор стало замечательно, что ведущие OSS модели все выходят из Китая. Где ведущие OSS модели из США? Сегодня это меняется. Многие называли Дришана и Дхрува сумасшедшими за то, что они взялись за этот вызов. Именно поэтому мы хотели работать с ними в @southpkcommons.
Взгляните:
Drishan Arora
Drishan Arora1 авг., 01:02
Сегодня мы выпускаем 4 гибридные модели рассуждений размером 70B, 109B MoE, 405B, 671B MoE под открытой лицензией. Это одни из самых мощных LLM в мире и служат доказательством концепции новой парадигмы ИИ - итеративного самоулучшения (системы ИИ, улучшающие себя). Самая большая модель 671B MoE является одной из самых мощных открытых моделей в мире. Она соответствует/превышает производительность последних моделей DeepSeek v3 и DeepSeek R1 и приближается к закрытым фронтовым моделям, таким как o3 и Claude 4 Opus.
8,22K