Я думал, что человечество в безопасности всего 2 дня назад, это буквально считается днями… Немного контекста: это не первый раз, когда ИИ занимает призовые места на Международной математической олимпиаде (IMO). В прошлом году AlphaProof от Google завоевал серебро, но эта модель была специально обучена для математики. На этот раз OpenAI использовал универсальную модель (вероятно, внутренний прототип GPT-5?), и она завоевала золото. Это огромный шаг вперед по значимости. Чтобы понять это в контексте: решение задачи уровня IMO обычно занимает у элитных человеческих участников около 100 минут. Всего 2 года назад лучшие модели ИИ все еще испытывали трудности с задачами начальной школы (GSM8k), которые люди решают за около 10 секунд. Как поделился Дэн Робертс из OpenAI на AI Ascent 2025 от Sequoia, длина задач, которые ИИ может обрабатывать, удваивается каждые 7 месяцев. К концу 2025 года GPT-5 вполне может работать на уровне задач, которые занимают у человека час. Одно замечание: в этом году на IMO, как сообщается, была ошибка в балансе сложности — задачи 1–5 были относительно легкими, в то время как задача 6 была необычно сложной. В результате многие оценки сконцентрировались между 28–35 (каждая задача стоит 7 баллов). ИИ набрал 35 — ровно достаточно для золота. Немного удачи, но траектория неоспорима. Наконец, математические соревнования, безусловно, будут гонкой между китайцами в Китае, китайцами в США и моделями ИИ (созданными китайцами в США и Китае).
Alexander Wei
Alexander Wei19 июл., 15:50
1/N Я рад поделиться тем, что наш последний экспериментальный LLM от @OpenAI достиг давнего грандиозного вызова в ИИ: золотого медального уровня на самом престижном математическом соревновании в мире — Международной математической олимпиаде (IMO).
5,45K