可能解決 AI 對齊問題的人 🦸‍♂️ 史蒂文·伯恩斯博士 (@steve47285) 是少數幾個既理解為什麼對齊困難,又在認真技術上嘗試解決它的人之一。 他有高達 90% 的 P(Doom),但他認為 LLM 在變得真正危險之前會達到平臺期,而真正的威脅將來自基於行為者-評論者強化學習的下一代“類腦 AGI”。 在獲得加州大學伯克利分校的物理學博士學位和哈佛的博士後研究後,他成為了 @AsteraInstitute 的 AGI 安全研究員。他現在深入研究人類大腦實際運作的神經科學,這些知識可能有助於我們解決技術上的 AI 對齊問題。 在這一集異常深入的節目中——因為對我的其他嘉賓表示尊重,我不必浪費時間與他爭論明顯的表面問題——我們討論了他的 "兩個子系統" 大腦模型,為什麼當前的 AI 安全方法未能達到目標,他對社會進化方法的不同看法,以及為什麼理解人類神經科學對於構建對齊的 AGI 重要。
在您的播客播放機中搜索“Doom Debates”或在 YouTube 上觀看:
來之不易的情況,來賓是對的!
Liron Shapira
Liron Shapira2025年7月30日
Most of my Doom Debates guests, with all due respect, are obviously wrong. This week we finally have someone who's ~100% right about everything, and has great credentials to back it up. Get ready for @steve47285…
9.14K