Cerebras a démontré sa capacité à héberger de grands MoEs à des vitesses très élevées cette semaine, lançant les points de terminaison Qwen3 235B 2507 et Qwen3 Coder 480B à >1 500 tokens de sortie/s ➤ @CerebrasSystems propose désormais des points de terminaison pour Qwen3 235B 2507 Raisonnement & Non-raisonnement. Les deux modèles ont 235B de paramètres au total avec 22B actifs. ➤ Qwen 3 235B 2507 Raisonnement offre une intelligence comparable à o4-mini (élevé) & DeepSeek R1 0528. La variante Non-raisonnement offre une intelligence comparable à Kimi K2 et bien au-dessus de GPT-4.1 et Llama 4 Maverick. ➤ Qwen3 Coder 480B a 480B de paramètres au total avec 35B actifs. Ce modèle est particulièrement puissant pour le codage agentique et peut être utilisé dans une variété d'outils d'agent de codage, y compris le Qwen3-Coder CLI. Les lancements de Cerebras représentent la première fois que ce niveau d'intelligence a été accessible à ces vitesses de sortie et ont le potentiel de débloquer de nouveaux cas d'utilisation - comme l'utilisation d'un modèle de raisonnement pour chaque étape d'un agent sans avoir à attendre des minutes.
25,06K