si te diera un cerebro de RL que pudiera probar miles de millones de acciones a gran escala, aprender de sus errores y adaptarse, pero tuvieras que elegir el entorno ¿qué entorno elegirías?
1,12K