🚨 AI模型刚刚发明了更好、更新颖的AI模型。 中国研究人员将所有LLM研究数据输入到一个模型中,结果发现了106种新颖的AI模型架构,这些架构在更好的基准测试中收敛到更低的损失。 ASI-Arch是今年最酷的AI论文之一。通往AGI的路上。
我知道时间线上有很多"哦,这真是糟糕"的评论。其中一些确实是很有效的批评,但我读了整篇论文,实际上它相当有趣。 目前也不清楚这些发现的模型架构如果扩大规模是否就不好。 它是否像本周的GSPO或HRM论文一样有用?也许不是,但我不太明白对此的部落主义。
163.36K