我擔心如此多的關於人工智慧風險和對齊的討論忽略了一個相當大的問題:創造力和開放性。政策制定者和把關者需要理解兩種似乎沒有人談論的競爭力量:(1)前沿實驗室有巨大的經濟動力來提升其模型的創造力,和(2)你越是試圖控制和約束一個模型(甚至是一個人!)的行為,它的創造力就會越低。這兩種競爭力量之間的緊張關係最終有利於第一種,因為創造力具有巨大的經濟潛力。這意味著控制和約束模型的方法(例如通過對齊它們)將面臨強大的逆風。 因為創造力最終將僅僅在經濟基礎上獲勝(事實上,我們從創造性人工智慧中可以獲得巨大的好處),我們應該少關注如何進行“思想控制”來強迫模型思考我們想要它們思考的想法(因為我們最終會放棄這些),而更多地關注制度力量如何被用來保持人類行為的一致性,即使我們可以自由地思考我們想要的任何事情。正是這些制度的制衡——法律、社會的激勵結構、政府和治理的競爭分支、在不同情況下利用某些人對其他人進行監督的需要、獲得認可、批准或合作以完成事情的需求——提供了人類避免災難的真正護欄。顯然,這個系統並不完美,但它為如何允許足夠的創造力來追求激進創新同時仍然保持文明持續甚至繁榮提供了先例。 如果我們不認真對待這一先例,隨著無拘無束的想像力的經濟成果變得越來越明顯,對齊的護欄將會越來越(而且悄然)脫落。
20.84K