DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Dans un article commun avec @OwainEvans_UK dans le cadre du programme des boursiers d'Anthropic, nous étudions un phénomène surprenant : l'apprentissage subliminal. Les modèles linguistiques peuvent transmettre leurs caractéristiques à d'autres modèles, même dans ce qui semble être des données sans signification.

L'apprentissage subliminal peut se produire pour des traits bénins (comme aimer les aigles) ou des traits plus préoccupants (comme le désalignement). Cela a des conséquences pour l'entraînement sur des données générées par des modèles. Lisez-en plus sur notre blog sur la science de l'alignement :

129,15K

Meilleurs

Classement

Favoris

Tendance on-chain

Tendance sur X

Récents financements de premier plan

Les plus notables