每个人都在询问美国的“DeepSeek”时刻。它来了。🇺🇸。 我们非常兴奋地发布Cogito v2。它是世界上最强大的开放模型之一。它的性能与最新的DeepSeek v3和DeepSeek R1模型相匹配/超越,并接近像o3这样的封闭前沿模型。 18个月前,认为可以在没有数十亿美元的组织之外训练出领先的OSS模型是异端邪说。 从那时起,领先的OSS模型都来自中国,这一点令人瞩目。 美国的领先OSS模型在哪里? 今天,这一切都将改变。 许多人称Drishan和Dhruv为疯子,因为他们接受了这个挑战。这正是我们想与他们在@southpkcommons合作的原因。
看看这个:
Drishan Arora
Drishan Arora8月1日 01:02
今天,我们发布了4个混合推理模型,大小分别为70B、109B MoE、405B和671B MoE,采用开放许可。 这些是世界上最强大的LLM之一,并作为一种新型AI范式的概念验证——迭代自我改进(AI系统自我改进)。 最大的671B MoE模型是世界上最强大的开放模型之一。它的性能与最新的DeepSeek v3和DeepSeek R1模型相匹配/超过,并接近于封闭前沿模型,如o3和Claude 4 Opus。
8.21K