Estamos lançando uma equipe de "psiquiatria de IA" como parte dos esforços de interpretabilidade da Anthropic!  Estaremos pesquisando fenômenos como personas de modelo, motivações e consciência situacional, e como eles levam a comportamentos assustadores / desequilibrados. Estamos contratando - junte-se a nós!
210,15K