Поздравляю команду GDM с их результатом IMO! Я думаю, что их параллельный успех подчеркивает, насколько быстро идет прогресс в области ИИ. Их подход был немного другим, чем наш, но я думаю, что это показывает, что существует множество направлений исследований для дальнейшего прогресса. Несколько мыслей о нашей модели и результатах 🧵
~2 месяца назад IMO отправила нам электронное письмо о возможности участия в формальной (Lean) версии IMO. Мы сосредоточились на общем рассуждении на естественном языке без ограничений Lean, поэтому мы отказались. К нам никогда не обращались по поводу варианта математического языка на естественном языке.
За последние несколько месяцев мы добились значительного прогресса в общем рассуждении. Это включало сбор, кураторство и обучение на высококачественных математических данных, которые также будут использованы в будущих моделях. В нашей оценке IMO мы не использовали RAG или какие-либо инструменты.
Прежде чем мы поделились нашими результатами, мы поговорили с членом правления IMO, который попросил нас подождать до окончания церемонии награждения, чтобы сделать это публично, просьбу, которую мы с радостью выполнили.
Мы объявили об этом примерно в 1:00 по тихоокеанскому времени (18:00 по австралийскому восточному времени), после завершения церемонии награждения. Никто не просил нас объявить позже.
Больше всего мы рады поделиться нашим прогрессом и результатами с миром. Возможности рассуждения ИИ развиваются быстро, и эти результаты IMO действительно это показывают.
252,49K