人們不理解強化學習的基本經濟學。 人工智慧實驗室在便宜的外包強化學習任務上訓練旗艦模型,浪費了寶貴的計算資源。這就像在法拉利上裝便宜的輪胎。 投資於優質任務,否則就浪費你的計算資源。
20.57K