Mọi người đã hỏi về khoảnh khắc "DeepSeek" của Mỹ. Nó đã đến. 🇺🇸. Chúng tôi vô cùng phấn khởi khi phát hành Cogito v2. Đây là một trong những mô hình mở mạnh nhất trên thế giới. Nó đạt hoặc vượt qua hiệu suất của các mô hình DeepSeek v3 và DeepSeek R1 mới nhất, và tiếp cận các mô hình biên đóng như o3. 18 tháng trước, thật là điều không tưởng khi nghĩ rằng bạn có thể đào tạo một mô hình OSS hàng đầu bên ngoài các tổ chức có ít nhất hàng chục tỷ đô la. Kể từ đó, thật đáng kinh ngạc khi các mô hình OSS hàng đầu đều đến từ Trung Quốc. Mô hình OSS hàng đầu từ Mỹ đâu? Hôm nay, điều đó sẽ thay đổi. Nhiều người đã gọi Drishan và Dhruv là điên rồ khi nhận thử thách này. Đó chính là lý do tại sao chúng tôi muốn làm việc với họ tại @southpkcommons.
Kiểm tra nó ra:
Drishan Arora
Drishan Arora01:02 1 thg 8
Hôm nay, chúng tôi phát hành 4 mô hình lý luận lai với kích thước 70B, 109B MoE, 405B, 671B MoE dưới giấy phép mở. Đây là một trong những LLM mạnh nhất trên thế giới, và là bằng chứng cho một khái niệm AI mới - tự cải thiện lặp đi lặp lại (các hệ thống AI cải thiện chính chúng). Mô hình lớn nhất 671B MoE nằm trong số những mô hình mở mạnh nhất trên thế giới. Nó đạt được hoặc vượt qua hiệu suất của các mô hình DeepSeek v3 và DeepSeek R1 mới nhất, và tiếp cận các mô hình biên giới đóng như o3 và Claude 4 Opus.
11,49K