人们不理解强化学习的基本经济学。 人工智能实验室在便宜的外包强化学习任务上训练旗舰模型,浪费了宝贵的计算资源。这就像在法拉利上装便宜的轮胎。 投资于优质任务,否则就浪费你的计算资源。
20.57K