だからこそ、近い将来、ヒューマン・イン・ザ・ループ・パイプラインが必要であり、タスクの複雑さと視野が上がるにつれて、成功率は大幅に低下します。成功率を維持するためには、人間が一貫してプロセスを接地する必要があります。 HITL アプローチの主な問題は次のとおりです。 1.微調整されたLLMは、出力が実際に客観的な要件を満たしているかどうかを人間が評価するのが難しいほど良くなっています。これは、「良く見える」ようにするために多くの作業が費やされているためです。 2. いつ人間が介入すべきか、またはエージェント/モデルがいつタスク/評価を引き継ぐべきかを知る。幻覚の検出は、とんでもない話題です
Benjamin Todd
Benjamin Todd2025年6月16日
なぜAIは1時間でコーディングできて、10時間ではコーディングできないのですか? 簡単な説明:10分のステップあたり10%の確率でエラーが発生する場合(たとえば)、成功率は次のようになります。 1時間:53% 4時間: 8% 10時間:0.002% @tobyordoxford、この「一定エラー率」理論をテストし、データが適切であることを示しました 成功の可能性は指数関数的に減少します
1.31K