estoy buscando buenos ejemplos de generalización de modelos de razonamiento por ejemplo, un modelo incentivado a través de RL para pensar un rato y resolver problemas matemáticos mejora en la escritura creativa ¿es esto común?
21.75K