Alle har spurt om USAs «DeepSeek»-øyeblikk. Den har kommet. 🇺🇸. Vi er utrolig glade for å gi ut Cogito v2. Det er blant de sterkeste åpne modellene i verden. Den matcher/overgår ytelsen til de nyeste DeepSeek v3- og DeepSeek R1-modellene begge, og nærmer seg lukkede frontmodeller som o3 For 18 måneder siden var det kjettersk å tro at du kunne trene en ledende OSS-modell utenfor organisasjonene som hadde noe mindre enn 10-vis av milliarder dollar. Siden da har det vært bemerkelsesverdig at de ledende OSS-modellene alle kommer ut av Kina. Hvor er de ledende OSS-modellene fra USA? I dag endrer det seg. Mange kalte Drishan og Dhruv gale for å ta denne utfordringen. Det var nettopp grunnen til at vi ønsket å jobbe med dem i @southpkcommons
Sjekk det ut:
Drishan Arora
Drishan Arora1. aug., 01:02
I dag lanserer vi 4 hybride resonneringsmodeller i størrelsene 70B, 109B MoE, 405B, 671B MoE under åpen lisens. Dette er noen av de sterkeste LLM-ene i verden, og fungerer som et bevis på konseptet for et nytt AI-paradigme - iterativ selvforbedring (AI-systemer som forbedrer seg selv). Den største 671B MoE-modellen er blant de sterkeste åpne modellene i verden. Den matcher/overgår ytelsen til de nyeste DeepSeek v3- og DeepSeek R1-modellene begge, og nærmer seg lukkede frontmodeller som o3 og Claude 4 Opus.
8,22K