Es posible que nos dirijamos a un giro en la trama de OpenAI vs. DeepMind IMO. Acabo de ver una publicación de Joseph Myers (involucrado en la Olimpiada de Matemáticas desde 1992): el comité de la OMI supuestamente pidió a los laboratorios de IA que no publicaran los resultados hasta 7 días después de la ceremonia de clausura, por respeto a los concursantes humanos (ver mi publicación de ayer) y probablemente para dar tiempo a la verificación adecuada de las presentaciones y formatos de IA. Según Joseph, OpenAI no colaboró con la OMI para probar su modelo, y ninguno de los 91 coordinadores oficiales de la OMI participó en la calificación de sus soluciones. Mientras tanto, parece que DeepMind está siguiendo las reglas y esperando pacientemente su turno. Para contextualizar: La OMI tiene 6 problemas, cada uno vale 7 puntos. El límite de oro de este año es de 35 puntos. Incluso una pequeña deducción podría derribar a OpenAI a plata. Y según mi lectura de sus escritos, algunas partes podrían generar preguntas, y posiblemente puntos de costo. Terence Tao también señaló que, si bien los problemas siguen siendo los mismos, los formatos de prueba son importantes. Un estudiante que no obtendría un bronce en condiciones estándar podría encontrar el oro con una configuración modificada, lo que plantea preguntas reales sobre lo que significa "resolver la OMI" para la IA. La próxima semana podría ser picante. Estén atentos.
Jasper
Jasper20 jul, 03:15
DeepMind obtuvo una medalla de oro en la OMI el viernes por la tarde. Pero tuvieron que esperar a que el marketing aprobara el tuit, hasta el lunes. @OpenAI compartió el suyo por primera vez a la 1 a.m. del sábado y se robó el centro de atención. En este juego, la velocidad > la burocracia. Pierde el momento, pierde la narrativa.
@swierk Encontraron 3 ex medallistas de la OMI que no eran coordinadores oficiales de la OMI: "Para cada problema, tres ex medallistas de la OMI calificaron de forma independiente la prueba presentada por el modelo, con puntajes finalizados después de un consenso unánime".
Alexander Wei
Alexander Wei19 jul, 15:50
6/N En nuestra evaluación, el modelo resolvió 5 de los 6 problemas en la OMI de 2025. Para cada problema, tres ex medallistas de la OMI calificaron de forma independiente la prueba presentada por el modelo, y los puntajes finalizaron después de un consenso unánime. El modelo obtuvo 35/42 puntos en total, ¡suficiente para el oro! 🥇
Mi publicación anterior sobre la solicitud del comité de la OMI
Jasper
Jasper20 jul, 05:42
Aclaración: alguien en Google me ha dicho que sus resultados de la OMI todavía se están verificando internamente. Una vez hecho esto, planean compartirlos oficialmente, curiosos por ver su enfoque. Otra fuente mencionó que el comité de la OMI pidió no discutir públicamente la participación de la IA dentro de una semana después de la ceremonia de clausura. Las cosas se pusieron un poco más interesantes 🧐
@GoogleDeepMind líder del equipo de razonamiento sobrehumano, @lmthang, también planteó la pregunta sobre si OpenAI ganaría un oro o una plata
Jasper
Jasper20 jul, 05:42
Aclaración: alguien en Google me ha dicho que sus resultados de la OMI todavía se están verificando internamente. Una vez hecho esto, planean compartirlos oficialmente, curiosos por ver su enfoque. Otra fuente mencionó que el comité de la OMI pidió no discutir públicamente la participación de la IA dentro de una semana después de la ceremonia de clausura. Las cosas se pusieron un poco más interesantes 🧐
@GoogleDeepMind líder del equipo de razonamiento sobrehumano @lmthang que construyó AlphaGeometry también planteó la pregunta sobre si OpenAI ganaría una medalla de oro o de plata
Thang Luong
Thang Luonghace 20 horas
Sí, existe una directriz oficial de calificación de los organizadores de la OMI que no está disponible externamente. Sin la evaluación basada en esa pauta, no se puede reclamar ninguna medalla. Con un punto deducido, es una plata, no oro.
@swierk sí, cada vez hay más preguntas planteadas por la gente de matemáticas e IA
Jasper
Jasperhace 16 horas
@GoogleDeepMind líder del equipo de razonamiento sobrehumano @lmthang que construyó AlphaGeometry también planteó la pregunta sobre si OpenAI ganaría una medalla de oro o de plata
87.33K