正確的看法。是的,我對大型語言模型(LLMs)能否創造出新的、有見地的數學持懷疑態度,因為這需要超出常規的思維,而它們在這方面表現不佳,所以在我看來這是一個很好的論點。但LLMs可以解決非常困難的數學*問題*(這是不同的),這真的很酷——只要它們不需要“新的、有見地的數學”。 一些數學問題需要新的有見地的定義,而它們之所以困難,正是因為這一點。並不是說它們在某種計算意義上本質上“沉重”,而是因為它們需要“想像力”和“創造力”來概念化沒人看過的奇妙結構。 例如,費馬最後定理的證明需要發展全新的數學工具——橢圓曲線、模形式和谷山-志村猜想——這些概念在問題首次提出時並不存在。 所以,如果我們在1650年就有LLMs,無論它們多麼努力地嘗試解決費馬最後定理——即使讓它計算幾個世紀——它也永遠無法做到,因為它會局限於當時存在的數學結構,而根本沒有解決方案的路徑。 現在,LLMs開始發明真正新的數學結構的那一天,就是它們能夠做到的那一天。 現在,這裡有一個最困難的問題: 什麼才算是“新的、有見地的數學概念”? 這怎麼能被定義? 許多東西都算作“新概念”。 我可以輕鬆地在Lean中寫一些隨機的詞彙,我就會創造出一個完全沒有人做過的全新數學概念。LLMs也可以做到這一點。這很簡單。 “有見地”的部分才是關鍵。 什麼使某樣東西“有見地”或“有趣”? 為什麼複數比隨機定義更有趣? 我們如何客觀地衡量一個Lean定義的有見地程度?
alz
alz8月23日 10:55
許多人認為大型語言模型(LLMs)仍然無法進行數學運算,而是稱之為專門的「數學引擎」。但許多人沒有意識到,實際上並不存在這樣的「數學引擎」。
784