Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Сьогодні ми в @OpenAI досягли віхи, про яку багато хто вважав: виступ на рівні золотої медалі на IMO 2025 із загальним обґрунтуванням LLM — за тими ж часовими обмеженнями, що й люди, без інструментів. Як би чудово це не звучало, але воно навіть важливіше, ніж заголовок 🧵

19 лип., 15:50
1/N Я радий повідомити, що наш останній @OpenAI експериментальний LLM досяг давнього грандіозного виклику в галузі штучного інтелекту: виступ на рівні золотої медалі на найпрестижнішому у світі математичному конкурсі — Міжнародній математичній олімпіаді (IMO).

Як правило, для таких результатів штучного інтелекту, як у Go/Dota/Poker/Diplomacy, дослідники витрачають роки на створення штучного інтелекту, який освоює одну вузьку сферу і мало що робить інакше. Але це не специфічна для IMO модель. Це обґрунтований LLM, який включає в себе нові експериментальні методи загального призначення.
Так що ж відрізняється? Ми розробили нові методи, які роблять LLM набагато кращими у завданнях, які важко перевірити. Ідеальним викликом для цього стали задачі IMO: коректури займають багато сторінок і на оцінювання експертів потрібні години. Порівняйте це з AIME, де відповіді є просто цілим числом від 0 до 999.
Також ця модель думає довго. О1 задумався на секунди. Глибоке дослідження протягом декількох хвилин. Цей думає годинами. Важливо, що він також ефективніше мислить. І є багато можливостей для подальшого підвищення обчислювальної ефективності під час тестування.

13 вер. 2024 р.
@OpenAI @rao2z @OpenAI O1 думає секундами, але ми націлені на майбутні версії, щоб думати годинами, днями і навіть тижнями. Витрати на висновок будуть вищими, але яку вартість ви б заплатили за нові ліки від раку? Для проривних акумуляторів? Для доказу гіпотези Рімана? Штучний інтелект може бути більшим, ніж чат-боти

Варто задуматися про те, наскільки швидким був прогрес штучного інтелекту, особливо в математиці. У 2024 році лабораторії штучного інтелекту використовували математику для початкової школи (GSM8K) як евал у своїх випусках моделей. З тих пір ми наситилися (старшокласним) тестом MATH, потім AIME, і тепер знаходимося на золотому рівні IMO.
До чого це призводить? Незважаючи на те, що останнім часом прогрес у сфері штучного інтелекту був швидким, я цілком очікую, що ця тенденція збережеться. Важливо, що я думаю, що ми близькі до того, щоб штучний інтелект зробив значний внесок у наукові відкриття. Є велика різниця між штучним інтелектом трохи нижчим за найвищу продуктивність людини та трохи вищим.
Це була невелика командна робота під керівництвом @alexwei_. Він узяв дослідницьку ідею, в яку мало хто вірив, і використав її для досягнення результату, про який мало хто думав. Це також було б неможливим без багаторічних досліджень + інженерних розробок від багатьох у @OpenAI та ширшої спільноти штучного інтелекту.
Коли ви працюєте в лабораторії на передовій, ви зазвичай знаєте, де знаходяться можливості фронтиру, на кілька місяців раніше, ніж будь-хто інший. Але цей результат абсолютно новий, з використанням нещодавно розроблених методик. Це стало сюрпризом навіть для багатьох дослідників з OpenAI. Сьогодні кожен може побачити, де проходить межа.
857,23K
Найкращі
Рейтинг
Вибране