热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
Grok 4 现在几乎不会在数学/物理考试问题上出错,除非这些问题设计得非常具有对抗性。
它可以识别问题中的错误或模糊之处,然后修正问题中的错误或回答每个模糊问题的不同变体。

7月10日 14:07
疯狂的是,埃隆·马斯克又一次成功了,彻底击溃了与Grok 4相关的AI战争。
总结核心公告:
— 后训练强化学习支出 == 预训练支出
— $3/M 输入,$15/M 输出标记,256k 上下文,价格是128k的2倍
— 人类最后考试(一般难题)第一名 44.4%,第二名 26.9%
— GPQA(难研究生问题)第一名 88.9%。第二名 86.4%
— AIME 2025(数学)第一名 100%,第二名 98.4%
— 哈佛MIT数学第一名 96.7%,第二名 82.5%
— USAMO25(数学)第一名 61.9%,第二名 49.4%
— ARC-AGI-2(对人类简单,对AI困难)第一名 15.9%,第二名 8.6%
— LiveCodeBench(1月-5月)第一名 79.4%,第二名 75.8%
Grok 4是“在每个学科上都可能优于博士水平,没有例外”..而且价格相当便宜。这是AI战争中的一个重大时刻,埃隆已经准备好参与其中。

6.33M
热门
排行
收藏