Nous réduisons le prix de o3 de 80 % et introduisons o3-pro dans l'API, qui utilise encore plus de puissance de calcul. o3 : Entrée : 2 $ / 1M de tokens Sortie : 8 $ / 1M de tokens Maintenant en vigueur. Nous avons optimisé notre pile d'inférence qui sert o3. Même modèle exact—juste moins cher.
o3-pro : Entrée : 20 $ / 1M tokens Sortie : 80 $ / 1M tokens (87 % moins cher que o1-pro !) Nous recommandons d'utiliser le mode arrière-plan avec o3-pro : les tâches de longue durée seront lancées de manière asynchrone, évitant ainsi les délais d'attente.
359,89K