Cerebras đã chứng minh khả năng của mình trong việc lưu trữ các MoE lớn với tốc độ rất cao trong tuần này, ra mắt các điểm cuối Qwen3 235B 2507 và Qwen3 Coder 480B với tốc độ >1.500 token đầu ra/s ➤ @CerebrasSystems hiện cung cấp các điểm cuối cho cả Qwen3 235B 2507 Lý luận & Không lý luận. Cả hai mô hình đều có tổng cộng 235B tham số với 22B đang hoạt động. ➤ Qwen 3 235B 2507 Lý luận cung cấp trí thông minh tương đương với o4-mini (cao) & DeepSeek R1 0528. Biến thể Không lý luận cung cấp trí thông minh tương đương với Kimi K2 và cao hơn nhiều so với GPT-4.1 và Llama 4 Maverick. ➤ Qwen3 Coder 480B có tổng cộng 480B tham số với 35B đang hoạt động. Mô hình này đặc biệt mạnh cho lập trình agentic và có thể được sử dụng trong nhiều công cụ lập trình agent, bao gồm cả Qwen3-Coder CLI. Các sản phẩm ra mắt của Cerebras đại diện cho lần đầu tiên mức độ trí thông minh này có thể truy cập với tốc độ đầu ra như vậy và có tiềm năng mở khóa các trường hợp sử dụng mới - như việc sử dụng mô hình lý luận cho mỗi bước của một agent mà không cần phải chờ đợi hàng phút.
25,06K