Es sorprendentemente difícil averiguar si OpenAI y Google DeepMind realmente obtuvieron un IMO Gold "justo y limpio" o no. Espero con interés más análisis.
Jasper Dekoninck
Jasper Dekoninck22 jul, 17:20
¡Enfoque interesante! Sin embargo, revisamos las pruebas y la metodología y encontramos algunos problemas, específicamente con el uso de pistas dadas al modelo. Aunque el andamiaje mejora el rendimiento, no resuelve todos los problemas con precisión y no obtendría una medalla de oro.🧵
1,4K