Je cherche de bons exemples de généralisation des modèles de raisonnement. Par exemple, un modèle incité par le RL à réfléchir un moment et à résoudre des problèmes mathématiques s'améliore en écriture créative. Est-ce courant ?
21,76K