Menjadi data pelatihan yang ingin Anda lihat di dunia
Anthropic
Anthropic2 Agu 2025
Penelitian Antropik Baru: Vektor Persona. Model bahasa terkadang kacau dan tergelincir ke dalam persona yang aneh dan meresahkan. Mengapa? Dalam sebuah makalah baru, kami menemukan "vektor persona"—pola aktivitas saraf yang mengendalikan sifat-sifat seperti kejahatan, kejahatan, atau halusinasi.
959