trở thành dữ liệu đào tạo mà bạn muốn thấy trong thế giới
Anthropic
Anthropic2 thg 8, 2025
Nghiên cứu nhân loại mới: Vectơ Persona. Các mô hình ngôn ngữ đôi khi trở nên rối loạn và rơi vào những tính cách kỳ lạ và đáng lo ngại. Tại sao? Trong một bài báo mới, chúng tôi tìm thấy "vectơ tính cách" - các mô hình hoạt động thần kinh kiểm soát các đặc điểm như xấu xa, ảo giác hoặc ảo giác.
957