si te diera un cerebro de RL que pudiera intentar miles de millones de acciones a escala, aprender de sus errores y adaptarse, pero tuvieras que elegir el entorno ¿Qué entorno elegirías?
1.12K