word de trainingsdata die je in de wereld wilt zien
Anthropic
Anthropic2 aug 2025
Nieuw antropisch onderzoek: Persona-vectoren. Taalmodellen raken soms in de war en vervallen in rare en verontrustende persona's. Waarom? In een nieuw artikel vinden we 'persona-vectoren' - neurale activiteitspatronen die eigenschappen als kwaad, sycofantie of hallucinatie beheersen.
961