Nous lançons un nouveau tour du programme des Anthropic Fellows. Si vous êtes un ingénieur ou un chercheur avec une solide expérience en codage ou en technique, vous pouvez postuler pour recevoir un financement, des ressources informatiques et du mentorat de la part d'Anthropic, à partir de ce mois d'octobre. Il y aura environ 32 places.
Le programme durera environ deux mois, avec des possibilités de prolongation de quatre mois supplémentaires en fonction des progrès et des performances. Postulez avant le 17 août pour nous rejoindre dans l'un de ces endroits : - États-Unis : - Royaume-Uni : - Canada :
Les boursiers auront accès à : - Une allocation hebdomadaire de 2 100 $ ; - ~15 000 $ par mois pour les coûts de calcul et de recherche ; - Mentorat 1:1 d’un chercheur anthropique ; - Espaces de travail partagés dans la région de la baie de San Francisco ou à Londres.
Les boursiers collaboreront avec des chercheurs anthropiques dans des domaines tels que : - Robustesse antagoniste et contrôle de l’IA ; - Surveillance évolutive ; - Organismes modèles de désalignement ; - Interprétabilité mécaniste.
2) Travail démontrant l'"apprentissage subliminal" – que les modèles de langage peuvent transmettre leurs caractéristiques à d'autres modèles, même dans ce qui semble être des données sans signification :
Anthropic
Anthropic23 juil. 2025
Dans un article commun avec @OwainEvans_UK dans le cadre du programme des boursiers d'Anthropic, nous étudions un phénomène surprenant : l'apprentissage subliminal. Les modèles linguistiques peuvent transmettre leurs caractéristiques à d'autres modèles, même dans ce qui semble être des données sans signification.
3) Trouver des cas de mise à l'échelle inverse dans le calcul au moment du test – où de plus en plus de raisonnement conduit à des résultats de plus en plus mauvais :
Aryo Pradipta Gema
Aryo Pradipta Gema22 juil. 2025
Nouvelle recherche d'Anthropic : « L'échelle inverse dans le calcul au moment du test » Nous avons trouvé des cas où un raisonnement plus long conduit à une précision inférieure. Nos résultats suggèrent qu'une mise à l'échelle naïve du calcul au moment du test peut renforcer involontairement des schémas de raisonnement problématiques. 🧵
Nous sommes heureux de recevoir des candidatures de Fellows affiliés à d'autres organisations (par exemple, vous pouvez participer tout en étant dans un programme de doctorat). Et enfin, une bourse vous sera bénéfique pour des postes chez Anthropic : nous prévoyons d'étendre certaines offres à temps plein aux Fellows ayant terminé.
276,76K