Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Acesta este exact motivul pentru care conductele human-in-the-loop sunt necesare în viitorul apropiat, pe măsură ce complexitatea sarcinilor și orizontul cresc, ratele de succes scad semnificativ. Veți avea nevoie de oameni care să împământeze în mod constant procesul pentru a menține ratele de succes.
Principalele probleme cu abordările HITL sunt:
1. LLM-urile reglate fin au devenit atât de bune încât este greu pentru oameni să evalueze dacă rezultatele îndeplinesc de fapt cerințele obiective, deoarece s-a muncit mult pentru a le face să "pară bune".
2. Știind când ar trebui să intervină un om sau când agentul/modelul ar trebui să predea sarcina/evaluarea. Detectarea halucinațiilor este un subiect al naibii

16 iun. 2025
De ce AI-urile pot codifica pentru 1 oră, dar nu pentru 10 ore?
O explicație simplă: dacă există o șansă de eroare de 10% pe pas de 10 minute (să zicem), rata de succes este:
1h: 53%
4h: 8%
10h: 0.002%
@tobyordoxford a testat această teorie a "ratei de eroare constante" și a arătat că se potrivește bine cu datele
șansele de succes scad exponențial

1,31K
Limită superioară
Clasament
Favorite