Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Сооснователь и генеральный директор @Hyperbolic_Labs. бывшие @avax и бывшие @citsecurities. Получил степень доктора философии по математике за 2 года @UCBerkeley. Золотая медалистка олимпиады по математике. Высшая честь @PKU1898
Мы, возможно, движемся к неожиданному повороту в саге OpenAI против DeepMind на IMO.
Только что увидел пост от Джозефа Майерса (участвует в Олимпиаде по математике с 1992 года): комитет IMO, по сообщениям, попросил лаборатории ИИ не публиковать результаты до 7 дней после закрытия церемонии — из уважения к участникам-людям (см. мой пост вчера) и, вероятно, чтобы дать время на надлежащую проверку поданных ИИ решений и форматов.
По словам Джозефа, OpenAI не сотрудничала с IMO для тестирования своей модели, и ни один из 91 официальных координаторов IMO не участвовал в оценке ее решений. Тем временем, похоже, что DeepMind соблюдает правила и терпеливо ждет своей очереди.
Для контекста:
В IMO 6 задач, каждая стоит 7 баллов. В этом году золотой порог составляет 35 баллов. Даже небольшое снижение может сбросить OpenAI до серебра. И, судя по их отчетам, некоторые части могут вызвать вопросы — и, возможно, стоить баллов.
Теренс Тао также отметил, что хотя задачи остаются прежними, форматы тестирования имеют значение. Студент, который не получил бы бронзу в стандартных условиях, может получить золото с измененной настройкой — что поднимает реальные вопросы о том, что значит "решить IMO" для ИИ.
На следующей неделе может быть интересно. Оставайтесь с нами.


68,09K
Только что закончил работу и попробовал Grok-4 на задаче по топологии для студентов. Это заняло 9 минут на размышления, а затем он уверенно дал чистый, правдоподобный, но совершенно неправильный ответ 😅
Не думаю, что это можно считать «умело противостоящим». Модели ИИ разрывают бенчмарки — но до настоящего математического AGI еще далеко.



Elon Musk10 июл., 16:47
Grok 4 is at the point where it essentially never gets math/physics exam questions wrong, unless they are skillfully adversarial.
It can identify errors or ambiguities in questions, then fix the error in the question or answer each variant of an ambiguous question.
662,98K
Grok получил максимальный балл на AIME 🤯 Нам определенно нужен лучший математический эталон для ИИ сейчас


xAI10 июл., 12:01
Представляем Grok 4, самую мощную модель ИИ в мире. Смотрите прямую трансляцию сейчас:
2,97K
Будущее ИИ — это сотрудничество.

Yuchen Jin9 июл., 06:09
Sam Altman was asked how he felt about Zuck and Meta poaching OpenAI’s top talent.
“Fine... good...” he said.
Behind Jony Ive–designed glasses, I couldn’t see his eyes. But I could feel the pain.
It's not hard for Zuck to poach OpenAI talent, not just because he has the money, but because open-source AI is fulfilling the original OpenAI mission.
1,43K
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные