torne-se os dados de treino que você quer ver no mundo
Anthropic
Anthropic2/08/2025
Nova pesquisa antrópica: vetores de persona. Os modelos de linguagem às vezes se desequilibram e se transformam em personas estranhas e inquietantes. Porquê? Em um novo artigo, encontramos "vetores de persona" – padrões de atividade neural que controlam características como maldade, bajulação ou alucinação.
970