Nous lançons une équipe de "psychiatrie IA" dans le cadre de nos efforts d'interprétabilité chez Anthropic ! Nous allons étudier des phénomènes tels que les personas des modèles, les motivations et la conscience situationnelle, et comment ils conduisent à des comportements étranges/déséquilibrés. Nous recrutons - rejoignez-nous !
210,14K