devenez les données d'entraînement que vous souhaitez voir dans le monde
Anthropic
Anthropic2 août 2025
Nouvelle recherche anthropique : les vecteurs de persona. Les modèles de langage se détraquent parfois et glissent vers des personnages étranges et troublants. Pourquoi? Dans un nouvel article, nous trouvons des « vecteurs de persona » – des modèles d’activité neuronale contrôlant des traits tels que le mal, la flagornerie ou l’hallucination.
966