Alle haben nach dem "DeepSeek"-Moment Amerikas gefragt. Er ist angekommen. 🇺🇸. Wir sind unglaublich aufgeregt, Cogito v2 zu veröffentlichen. Es gehört zu den stärksten offenen Modellen der Welt. Es erreicht/übertrifft die Leistung der neuesten DeepSeek v3- und DeepSeek R1-Modelle und nähert sich geschlossenen Grenzmodellen wie o3. Vor 18 Monaten war es als ketzerisch anzusehen, zu denken, dass man ein führendes OSS-Modell außerhalb der Organisationen trainieren könnte, die weniger als 10 Milliarden Dollar hatten. Seitdem ist es bemerkenswert, dass die führenden OSS-Modelle alle aus China kommen. Wo sind die führenden OSS-Modelle aus den USA? Heute ändert sich das. Viele Leute haben Drishan und Dhruv für verrückt gehalten, diese Herausforderung anzunehmen. Das war genau der Grund, warum wir mit ihnen bei @southpkcommons arbeiten wollten.
Schaut es euch an:
Drishan Arora
Drishan Arora1. Aug., 01:02
Heute veröffentlichen wir 4 hybride Denkmodelle mit den Größen 70B, 109B MoE, 405B und 671B MoE unter offener Lizenz. Dies sind einige der stärksten LLMs der Welt und dienen als Proof of Concept für ein neuartiges KI-Paradigma - iterative Selbstverbesserung (KI-Systeme, die sich selbst verbessern). Das größte Modell mit 671B MoE gehört zu den stärksten offenen Modellen der Welt. Es erreicht/übertrifft die Leistung der neuesten DeepSeek v3 und DeepSeek R1 Modelle und nähert sich geschlossenen Grenzmodellen wie o3 und Claude 4 Opus.
8,22K