يفكر إريك جانغ في التعلم RL مقابل التعلم الخاضع للإشراف لمهام معالجة الروبوت البشري.
‏‎10.35‏K