我們正在啟動一個「AI 精神病學」團隊,作為 Anthropic 解釋性努力的一部分!我們將研究模型人格、動機和情境意識等現象,以及它們如何導致可怕/失控的行為。我們正在招聘 - 加入我們吧!
210.13K