热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
关于人工智能和国际数学奥林匹克的周末真是疯狂。回顾过去的三天,我目睹了:
> 周五下午:关于DeepMind赢得金牌的泄露信息
> 周六凌晨1点:OpenAI抢先发布了官方公告,抢走了风头
> 起初以为谷歌只是因为市场营销审批而反应慢
> 然后听到谷歌的人说IMO和他们自己需要额外的时间进行验证
> 结果发现OpenAI甚至没有正式涉及IMO
> 周一:DeepMind确认了他们的金牌,答案更清晰、更美观,完全经过IMO验证
上周五在X上第一个分享这个消息真是有趣。真是个疯狂的周末!
开玩笑的说,最近关于数学人工智能的炒作很多,但我们更需要的是严谨和标准化。正如Terence Tao所指出的,即使结果看起来相似,测试格式的差异也可能产生巨大的影响。我们在人工智能研究中仍然远未拥有清晰、一致的标准和信息。
如果我们想要有意义的进展,是时候让社区站出来了。让我们建立大家都能信任的基准。
4.87K
热门
排行
收藏