Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
En un artículo conjunto con @OwainEvans_UK como parte del Programa de Becarios Antrópicos, estudiamos un fenómeno sorprendente: el aprendizaje subliminal.
Los modelos de lenguaje pueden transmitir sus rasgos a otros modelos, incluso en lo que parecen ser datos sin sentido.

23 jul, 00:06
Nuevo papel y resultado sorprendente.
Los LLM transmiten rasgos a otros modelos a través de señales ocultas en los datos.
Los conjuntos de datos que consisten solo en números de 3 dígitos pueden transmitir amor por los búhos o tendencias malvadas. 🧵

El aprendizaje subliminal puede ocurrir para rasgos benignos (como el gusto por las águilas) o rasgos más preocupantes (como la desalineación). Esto tiene consecuencias para el entrenamiento con datos generados por modelos.
Lea más en nuestro blog de Alignment Science:

156.9K
Populares
Ranking
Favoritas