每個人都在詢問美國的 "DeepSeek" 時刻。它來了。🇺🇸。 我們非常高興地推出 Cogito v2。它是世界上最強大的開放模型之一。它的性能與最新的 DeepSeek v3 和 DeepSeek R1 模型相匹配/超越,並接近像 o3 這樣的封閉前沿模型。 18 個月前,認為可以在沒有十幾億美元的組織之外訓練出領先的 OSS 模型是異端的想法。 自那時以來,領先的 OSS 模型全都來自中國,這是非常驚人的。 美國的領先 OSS 模型在哪裡? 今天,這一切都將改變。 許多人稱 Drishan 和 Dhruv 為瘋子,因為他們接受了這個挑戰。這正是我們想與他們在 @southpkcommons 合作的原因。
看看吧:
Drishan Arora
Drishan Arora8月1日 01:02
今天,我們發布了4個混合推理模型,大小分別為70B、109B MoE、405B和671B MoE,並在開放許可下提供。 這些是世界上最強大的LLM之一,並作為一種新型AI範式的概念驗證——迭代自我改進(AI系統自我改進)。 最大的671B MoE模型是世界上最強大的開放模型之一。它的性能與最新的DeepSeek v3和DeepSeek R1模型相匹配/超越,並接近封閉邊界模型,如o3和Claude 4 Opus。
8.21K