Não se preocupe, vamos apenas rastrear os dados de treinamento para que o agente nunca tenha que ver exemplos de mau comportamento.
Owain Evans
Owain Evans23 de jul., 00:06
Novo papel e resultado surpreendente. Os LLMs transmitem características para outros modelos por meio de sinais ocultos nos dados. Conjuntos de dados que consistem apenas em números de 3 dígitos podem transmitir um amor por corujas ou tendências malignas. 🧵
Na verdade, me lembra de "reflexões sobre confiança na confiança" agora
14,12K