Iedereen vraagt naar het "DeepSeek" moment van Amerika. Het is aangekomen. 🇺🇸. We zijn ongelooflijk enthousiast om Cogito v2 uit te brengen. Het is een van de sterkste open modellen ter wereld. Het evenaart/overtreft de prestaties van de nieuwste DeepSeek v3 en DeepSeek R1 modellen, en benadert gesloten grensmodellen zoals o3. 18 maanden geleden was het ketters om te denken dat je een leidend OSS-model kon trainen buiten de organisaties die minder dan tientallen miljarden dollars hadden. Sindsdien is het opmerkelijk dat de leidende OSS-modellen allemaal uit China komen. Waar zijn de leidende OSS-modellen uit de VS? Vandaag verandert dat. Veel mensen noemden Drishan en Dhruv gek omdat ze deze uitdaging aangingen. Dat was precies de reden waarom we met hen wilden samenwerken bij @southpkcommons.
Bekijken:
Drishan Arora
Drishan Arora1 aug, 01:02
Vandaag brengen we 4 hybride redeneermodellen uit van de groottes 70B, 109B MoE, 405B, 671B MoE onder open licentie. Dit zijn enkele van de sterkste LLM's ter wereld en dienen als bewijs van een nieuw AI-paradigma - iteratieve zelfverbetering (AI-systemen die zichzelf verbeteren). Het grootste 671B MoE-model behoort tot de sterkste open modellen ter wereld. Het evenaart/overtreft de prestaties van de nieuwste DeepSeek v3 en DeepSeek R1 modellen, en benadert gesloten grensmodellen zoals o3 en Claude 4 Opus.
11,49K