Людина, яка може вирішити проблему вирівнювання 🦸 ♂️ штучного інтелекту Доктор Стівен Бірнс (@steve47285) - один з небагатьох людей, хто розуміє, чому вирівнювання - це важко, і робить серйозний технічний крок до його вирішення. Він має колосальні 90% P(Doom), але стверджує, що LLM вийдуть на плато, перш ніж стануть по-справжньому небезпечними, а реальна загроза виходитиме від наступного покоління «мозкоподібних AGI», заснованих на навчанні актора-критика з підкріпленням. Після отримання ступеня доктора філософії з фізики та постдоктора Гарвардського університету в Берклі він став дослідником безпеки AGI в @AsteraInstitute. Тепер він глибоко занурений у нейронауку зворотного проектування того, як насправді працює людський мозок, знання, які можуть правдоподібно допомогти нам вирішити проблему технічного вирівнювання штучного інтелекту. У цьому надзвичайно глибокому епізоді — тому що, при всій повазі до інших моїх гостей, мені не довелося витрачати час на суперечки з ним про очевидні поверхневі проблеми — ми говоримо про його модель мозку «двох підсистем», про те, чому сучасні підходи до безпеки штучного інтелекту не влучають у ціль, про його розбіжності з підходами соціальної еволюції та про те, чому розуміння людської нейронауки має значення для побудови узгодженого AGI.
Шукайте "Doom Debates" у своєму програвачі подкастів або дивіться на YouTube:
Рідкісний епізод, де гість ПРАВИЙ!
Liron Shapira
Liron Shapira30 лип. 2025 р.
Most of my Doom Debates guests, with all due respect, are obviously wrong. This week we finally have someone who's ~100% right about everything, and has great credentials to back it up. Get ready for @steve47285…
9,13K