正确的看法。是的,我对大型语言模型(LLMs)能否创造出新的、有见地的数学持怀疑态度,因为这需要超出常规的思维,而它们在这方面表现不佳,所以在我看来这是一个很好的论点。但LLMs可以解决非常困难的数学*问题*(这是不同的),这真的很酷——只要它们不需要“新的、有见地的数学”。 一些数学问题需要新的有见地的定义,而它们之所以困难,正是因为这一点。并不是说它们在某种计算意义上本质上“沉重”,而是因为它们需要“想象力”和“创造力”来概念化没人看过的奇妙结构。 例如,费马最后定理的证明需要发展全新的数学工具——椭圆曲线、模形式和谷山-志村猜想——这些概念在问题首次提出时并不存在。 所以,如果我们在1650年就有LLMs,无论它们多么努力地尝试解决费马最后定理——即使让它计算几个世纪——它也永远无法做到,因为它会局限于当时存在的数学结构,而根本没有解决方案的路径。 现在,LLMs开始发明真正新的数学结构的那一天,就是它们能够做到的那一天。 现在,这里有一个最困难的问题: 什么才算是“新的、有见地的数学概念”? 这怎么能被定义? 许多东西都算作“新概念”。 我可以轻松地在Lean中写一些随机的词汇,我就会创造出一个完全没有人做过的全新数学概念。LLMs也可以做到这一点。这很简单。 “有见地”的部分才是关键。 什么使某样东西“有见地”或“有趣”? 为什么复数比随机定义更有趣? 我们如何客观地衡量一个Lean定义的有见地程度?
alz
alz8月23日 10:55
许多人认为大型语言模型(LLMs)仍然无法进行数学运算,而是称之为专门的“数学引擎”。但许多人没有意识到,实际上并不存在这样的“数学引擎”。
839