Acesta este exact motivul pentru care conductele human-in-the-loop sunt necesare în viitorul apropiat, pe măsură ce complexitatea sarcinilor și orizontul cresc, ratele de succes scad semnificativ. Veți avea nevoie de oameni care să împământeze în mod constant procesul pentru a menține ratele de succes. Principalele probleme cu abordările HITL sunt: 1. LLM-urile reglate fin au devenit atât de bune încât este greu pentru oameni să evalueze dacă rezultatele îndeplinesc de fapt cerințele obiective, deoarece s-a muncit mult pentru a le face să "pară bune". 2. Știind când ar trebui să intervină un om sau când agentul/modelul ar trebui să predea sarcina/evaluarea. Detectarea halucinațiilor este un subiect al naibii
Benjamin Todd
Benjamin Todd16 iun. 2025
De ce AI-urile pot codifica pentru 1 oră, dar nu pentru 10 ore? O explicație simplă: dacă există o șansă de eroare de 10% pe pas de 10 minute (să zicem), rata de succes este: 1h: 53% 4h: 8% 10h: 0.002% @tobyordoxford a testat această teorie a "ratei de eroare constante" și a arătat că se potrivește bine cu datele șansele de succes scad exponențial
1,31K