Nos lleva unos meses convertir la frontera de la investigación experimental en un producto. Pero el progreso es tan rápido que unos pocos meses pueden significar una gran diferencia en las capacidades.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 jul, 09:17
Entonces, ¿todos los modelos tienen un rendimiento inferior al de los humanos en las nuevas preguntas de la Olimpiada Internacional de Matemáticas, y Grok-4 es especialmente malo en eso, incluso con la selección al mejor de n? ¡Increíble!
113.89K