gdybym dał ci mózg RL, który mógłby próbować miliardów działań na dużą skalę, uczyć się na swoich błędach i dostosowywać, ale musiałbyś wybrać środowisko jakie środowisko byś wybrał?
1,12K