Más avistamientos de Número Cinco. Esta persona ha recibido acceso anticipado a GPT-5-reasoning (medio) para pruebas.
leo 🐈
leo 🐈2 ago, 22:03
Como habrás notado arriba, he tenido acceso a una versión de GPT-5 antes de tiempo. Establece un nuevo SoTA por un margen significativo en este benchmark y lo hace mucho mejor que o3-high. Es un gran modelo. Por otro lado, el mejor modelo de Anthropic se queda atrás. El de Google está en la media.
46,59K