Semua orang telah bertanya tentang momen "DeepSeek" Amerika. Itu tiba. 🇺🇸. Kami sangat bersemangat untuk merilis Cogito v2. Ini adalah salah satu model terbuka terkuat di dunia. Ini cocok/melampaui kinerja model DeepSeek v3 dan DeepSeek R1 terbaru, dan mendekati model perbatasan tertutup seperti o3 18 bulan yang lalu, adalah sesat untuk berpikir bahwa Anda dapat melatih model OSS terkemuka di luar organisasi yang memiliki kurang dari 10-an miliar dolar. Oleh karena itu, sungguh luar biasa bahwa model OSS terkemuka semuanya berasal dari China. Di mana model OSS terkemuka di luar AS? Hari ini, itu berubah. Banyak orang menyebut Drishan dan Dhruv gila karena menerima tantangan ini. Itulah alasan yang tepat mengapa kami ingin bekerja dengan mereka di @southpkcommons
Coba lihat:
Drishan Arora
Drishan Arora1 Agu, 01.02
Hari ini, kami merilis 4 model penalaran hibrida ukuran 70B, 109B MoE, 405B, 671B MoE di bawah lisensi terbuka. Ini adalah beberapa LLM terkuat di dunia, dan berfungsi sebagai bukti konsep untuk paradigma AI baru - peningkatan diri berulang (sistem AI yang meningkatkan diri mereka sendiri). Model MoE 671B terbesar adalah salah satu model terbuka terkuat di dunia. Ini cocok/melampaui kinerja model DeepSeek v3 dan DeepSeek R1 terbaru, dan mendekati model perbatasan tertutup seperti o3 dan Claude 4 Opus.
8,2K