Alla har frågat om USA:s "DeepSeek"-ögonblick. Den har anlänt. 🇺🇸. Vi är otroligt glada över att släppa Cogito v2. Det är bland de starkaste öppna modellerna i världen. Den matchar/överträffar prestandan hos de senaste DeepSeek v3- och DeepSeek R1-modellerna och närmar sig modeller med sluten gräns som o3 För 18 månader sedan var det kätterskt att tro att man kunde träna en ledande OSS-modell utanför de organisationer som hade något mindre än 10-tals miljarder dollar. Därför har det varit anmärkningsvärt att de ledande OSS-modellerna alla kommer från Kina. Var finns de ledande OSS-modellerna från USA? I dag är det ändring på det. Många människor kallade Drishan och Dhruv galna för att de tog sig an denna utmaning. Det var den exakta anledningen till att vi ville arbeta med dem på @southpkcommons
Kolla in det:
Drishan Arora
Drishan Arora1 aug. 01:02
Idag släpper vi 4 hybridmodeller av storlekarna 70B, 109B MoE, 405B, 671B MoE under öppen licens. Dessa är några av de starkaste LLM:erna i världen och fungerar som ett bevis på konceptet för ett nytt AI-paradigm - iterativ självförbättring (AI-system som förbättrar sig själva). Den största 671B MoE-modellen är bland de starkaste öppna modellerna i världen. Den matchar/överträffar prestandan hos de senaste DeepSeek v3- och DeepSeek R1-modellerna, och närmar sig modeller med sluten gräns som o3 och Claude 4 Opus.
12,54K