一種簡單的AGI安全技術:AI的思維用簡單的英語表達,只需閱讀它們 我們知道這是有效的,具有OK(不是完美)的透明度! 風險在於脆弱性:強化學習訓練、新架構等威脅透明度 來自許多組織的專家一致認為我們應該努力保護它:🧵
183.62K