Kami meluncurkan tim "psikiatri AI" sebagai bagian dari upaya interpretabilitas di Anthropic!  Kami akan meneliti fenomena seperti persona model, motivasi, dan kesadaran situasional, dan bagaimana mereka mengarah pada perilaku seram/tidak terkendali. Kami sedang merekrut - bergabunglah dengan kami!
210,12K