Estoy buscando buenos ejemplos de generalización de modelos de razonamiento. Por ejemplo, un modelo incentivado a través de RL para pensar un rato y resolver problemas matemáticos mejora en la escritura creativa. ¿Es esto común?
21,86K