Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Detta är ett av de bästa blogginläggen 2025 av OpenAI-forskaren @ShunyuYao12.
"vi är i halvtid för AI"
Det är en spelbok för vad som kommer att betyda mest inom AI-forskning och startup-ekosystemet, och hur man bäst förbereder sig för det.
I årtionden har AI-forskningen fokuserat på algoritmer och nya modeller för att slå riktmärkena.
men något viktigt har förändrat spelet: "RL generaliserar äntligen."
det fungerande "receptet": massiv språkförträning (priors) + skala + reasoning-as-action inuti en RL-loop.
resultatet av denna benchmarkklättring. Spelet skiftar: från att lösa problem till att definiera de rätta problemen. Utvärderingen står i centrum.
Det viktigaste riktmärket är nu "nyttoproblemet". Benchmarks översätts inte riktigt bra till verkliga uppgifter.
Så det här är den andra halvan av spelboken: uppfinn utvärderingsuppställningar som är knutna till verklig nytta; Använd sedan receptet för att vinna enligt de nya reglerna.
i RL är nyckeltrion miljö, algoritmer och priorer. Vi har spenderat så mycket tid på de bästa Algos men Algos är överanpassade till miljön de är födda i.
för den "andra halvan" är utvärdering = miljödesign: bygg uppställningar närmare verkligheten (människa-i-loopen, icke-IID, sekventiell/med minne) för att driva verklig nytta, inte bara benchmark-vinster.

84,2K
Topp
Rankning
Favoriter