Mặc dù Kimi k2 của Moonshot AI là mô hình không suy luận có trọng số mở hàng đầu trong Chỉ số Trí tuệ Phân tích Nhân tạo, nhưng nó tạo ra nhiều token hơn ~ 3 lần so với các mô hình không suy luận khác, làm mờ ranh giới giữa suy luận và không lý luận Kimi k2 là mô hình trọng lượng mở lớn nhất từ trước đến nay - tổng số tham số 1T với 32B hoạt động (điều này yêu cầu bộ nhớ lớn 1TB ở FP8 gốc để giữ trọng số). Chúng tôi có k2 ở vị trí 57 trong Chỉ số Trí tuệ Phân tích Nhân tạo, một điểm số ấn tượng đặt nó trên các mô hình như GPT-4.1 và DeepSeek V3, nhưng đứng sau các mô hình suy luận hàng đầu. Cho đến nay, đã có sự khác biệt rõ ràng giữa mô hình suy luận và mô hình phi lý luận trong các đánh giá của chúng tôi - được xác định không chỉ bởi việc mô hình có sử dụng thẻ hay không <reasoning> , mà chủ yếu bởi việc sử dụng mã thông báo. Số lượng token trung bình được sử dụng để trả lời tất cả các đánh giá trong Chỉ số Trí tuệ Phân tích Nhân tạo cao hơn ~ 10 lần đối với các mô hình suy luận so với các mô hình không lý luận. Kimi k2 của @Kimi_Moonshot sử dụng ~3 lần số lượng mã thông báo mà mô hình không suy luận trung bình sử dụng. Việc sử dụng token của nó chỉ thấp hơn tới 30% so với Claude 4 Sonnet và Opus khi chạy ở chế độ tư duy mở rộng ngân sách tối đa của họ và gần gấp ba lần mức sử dụng token của cả Claude 4 Sonnet và Opus khi tắt lý luận. Do đó, chúng tôi khuyên bạn nên so sánh Kimi k2 với Claude 4 Sonnet và Opus trong các chế độ tư duy mở rộng ngân sách tối đa của chúng, không phải với điểm số không lý luận cho các mẫu Claude 4. Kimi k2 có sẵn trên API của bên thứ nhất của @Kimi_Moonshot cũng như @FireworksAI_HQ, @togethercompute, @novita_labs và @parasail_io. Xem bên dưới và trên Phân tích nhân tạo để phân tích 👇 thêm
60,55K