весело: 3/4 месяца назад я запускал o3 для некоторых академиков на частном тестовом наборе задач, похожих на AIME. Им потребовалось так много времени, чтобы написать резюме результатов (96%), что Алекс в это время решил IMO.
133