正确的看法。是的,我对大型语言模型(LLMs)能否创造出新的、有见地的数学持怀疑态度,因为这需要超出常规的思维,而它们在这方面表现不佳。但LLMs可以解决非常困难的数学*问题*(这是不同的),这真的很酷——只要它们不需要“新的、有见地的定义”。 一些数学问题需要“新的、有见地的定义”,而它们之所以困难,正是因为这一点。并不是说它们在某种计算意义上本质上“沉重”,而是因为它们需要“想象力”和“创造力”来概念化那些没有人之前看过的奇妙结构。 例如,费马大定理的证明需要开发全新的数学工具——椭圆曲线、模形式和谷山-志村猜想——这些概念在问题首次提出时并不存在。 所以,如果我们在1650年就有LLMs,无论它们多么努力地尝试解决费马大定理——即使让它计算几个世纪——它也永远无法做到,因为它会局限于当时存在的数学结构,而根本没有解决方案的路径。 现在,当LLMs开始发明真正新的数学结构时,那就是它们能够证明“困难”定理的时刻。这是将它们与能够做到这一点的能力区分开的唯一因素。 现在,这暴露了最困难的问题: 什么才算是“新的、有见地的数学概念”? 这怎么能被定义? 许多东西都算作“新概念”。我可以轻松地在Lean中写一些随机的词汇,我就会创造出一个完全新的数学概念,没人之前做过。LLMs也可以做到这一点。这很简单。 “有见地”的部分才是这里重要的 什么使某件事“有见地”或“有趣”? 为什么复数比随机定义更有趣? 我们如何客观地衡量一个Lean定义的有见地程度?
alz
alz8月23日 10:55
许多人认为大型语言模型(LLMs)仍然无法进行数学运算,而是称之为专门的“数学引擎”。但许多人没有意识到,实际上并不存在这样的“数学引擎”。
682