To je přesně důvod, proč jsou v dohledné budoucnosti nezbytné kanály typu human-in-the-loop, protože složitost úkolů a horizont se zvyšuje, úspěšnost výrazně klesá. Budete potřebovat, aby lidé tento proces důsledně uzemnili, abyste udrželi úspěšnost. Hlavní problémy s přístupy HITL jsou: 1. Vyladěné LLM se dostaly do bodu, kdy je pro lidi těžké posoudit, zda výstupy skutečně splňují objektivní požadavky, protože bylo vynaloženo hodně práce na tom, aby to "vypadalo dobře". 2. Vědět, kdy by měl zasáhnout člověk nebo kdy by měl agent/model předat úkol/hodnocení. Detekce halucinací je zatraceně velké téma
Benjamin Todd
Benjamin Todd16. 6. 2025
Proč mohou umělé inteligence kódovat 1 hodinu, ale ne 10 hodin? Jednoduché vysvětlení: pokud je 10% pravděpodobnost chyby na 10minutový krok (řekněme), úspěšnost je: 1h: 53 % 4h: 8 % 10h: 0,002 % @tobyordoxford tuto teorii "konstantní chybovosti" otestoval a ukázal, že je pro data vhodná šance na úspěch exponenciálně klesá
1,28K