Det är just därför som pipelines för människor i loopen är nödvändiga under överskådlig framtid, i takt med att uppgiftens komplexitet och horisonten ökar, sjunker framgångsfrekvensen avsevärt. Du behöver människor för att konsekvent grunda processen för att upprätthålla framgångsfrekvensen. De viktigaste problemen med HITL-metoder är: 1. finjusterade LLM:er har blivit så bra till en punkt där det är svårt för människor att bedöma om resultaten faktiskt uppfyller objektiva krav eftersom mycket arbete har lagts ner på att få det att "verka bra". 2. Att veta när en människa ska ingripa eller när agenten/modellen ska lämna över uppgiften/utvärderingen. Att upptäcka hallucinationer är ett ämne
Benjamin Todd
Benjamin Todd16 juni 2025
Varför kan AI koda för 1 timme men inte 10 timmar? En enkel förklaring: om det finns en 10% risk för fel per 10 minuters steg (säg), är framgångsfrekvensen: 1 timme: 53 % 4h: 8 % 10h: 0,002 % @tobyordoxford har testat denna teori om "konstant felfrekvens" och visat att den passar bra för data Chansen att lyckas minskar exponentiellt
1,31K