To jest bardzo ważna praca. Moim zdaniem najbardziej niedostatecznie zbadanym pomysłem polityki AI jest bezpieczeństwo i śledzenie łańcucha dostaw, które wydaje się, że może stać się kluczowe dla formułowania stwierdzeń dotyczących właściwości bezpieczeństwa modeli.
Owain Evans
Owain Evans23 lip 2025
New paper & surprising result. LLMs transmit traits to other models via hidden signals in data. Datasets consisting only of 3-digit numbers can transmit a love for owls, or evil tendencies. 🧵
3,06K