Lansăm o echipă de "psihiatrie AI" ca parte a eforturilor de interpretabilitate la Anthropic!  Vom cerceta fenomene precum personajele model, motivațiile și conștientizarea situației și modul în care acestea duc la comportamente înfricoșătoare/dezechilibrate. Angajăm - alăturați-vă nouă!
210,13K