Ми запускаємо команду «Психіатрія зі штучним інтелектом» у рамках зусиль з інтерпретації в Anthropic!  Ми будемо досліджувати такі феномени, як модельні персони, мотивації та ситуаційна обізнаність, а також те, як вони призводять до моторошної/непристойної поведінки. Ми приймаємо на роботу - приєднуйтесь до нас!
210,12K