GPT 5.4 Pro acaba de aplastar el benchmark matemático más difícil, FrontierMath Tier 4, con un 38%. Estos 50 problemas matemáticos de nivel de investigación pueden llevar a los matemáticos semanas para resolver. Hace un año, lo mejor era un 2% (o3). El mejor modelo de código abierto es un 4.2% (Kimi K2.5) Increíblemente impresionante.