En enkel AGI-säkerhetsteknik: AI:s tankar är på vanlig engelska, det är bara att läsa dem Vi vet att det fungerar, med OK (inte perfekt) transparens! Risken är bräcklighet: RL-utbildning, nya arkitekturer etc. hotar transparensen Experter från många organisationer är överens om att vi bör försöka bevara den: 🧵
183,64K