diversão: há 3/4 meses, executei o3 para alguns acadêmicos em um conjunto de testes privado de problemas semelhantes ao AIME. Levou tanto tempo para eles escreverem um resumo dos resultados (96%) que o Alex resolveu o IMO nesse meio tempo.
135