热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我们驻场的 @delphi_intel 建设者 @lex_feeds 又带来了一个精彩的作品
如果你还没有关注他,快去关注吧

7月20日 01:50
就在两天前,我还以为人类是安全的,真的是以天为单位在倒计时……
一些背景:这并不是人工智能第一次在国际数学奥林匹克(IMO)中获奖。去年,谷歌的AlphaProof获得了银牌——但那个模型是专门为数学训练的。
这一次,OpenAI使用了一个通用模型(可能是内部的GPT-5原型?),并且赢得了金牌。这是一个巨大的飞跃。
为了让大家更好地理解:解决一个IMO级别的问题通常需要顶尖人类选手大约100分钟。就在两年前,顶尖的人工智能模型仍在努力解决小学水平的文字问题(GSM8k),人类大约需要10秒钟就能解决。
正如OpenAI的Dan Roberts在红杉资本的AI Ascent 2025上分享的那样,人工智能能够处理的任务长度每7个月就会翻一番。到2025年底,GPT-5很可能会在小时级人类任务水平上运作。
一个警告:据报道,今年的IMO在难度平衡上存在缺陷——问题1到5相对简单,而问题6则异常困难。因此,许多分数集中在28到35之间(每个问题值7分)。人工智能得分为35——刚好够得金牌。这有点运气成分,但这个轨迹是不可否认的。
最后,数学竞赛无疑将成为中国的中国人、美国的中国人和人工智能模型(由在美国和中国的中国人构建)之间的竞赛。
2.34K
热门
排行
收藏