Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Parempia vertailuarvoja rakentavat yritykset kasvavat nopeammin kuin parempia malleja rakentavat yritykset
Tekoäly voi jo ratkaista shakki-, koke- ja koodauskilpailuja, mutta ei silti pysty varaamaan illallisvarausta luotettavasti
Pullonkaula on siirtynyt älykkyydestä arviointiin

27.8.2025
Tämä on yksi OpenAI-tutkijan vuoden 2025 parhaista blogikirjoituksista @ShunyuYao12.
"olemme tekoälyn puoliajalla,"
se on pelikirja siitä, mikä on tärkeintä tekoälytutkimuksessa ja startup-ekosysteemissä ja miten siihen voidaan valmistautua parhaiten.
Vuosikymmenten ajan tekoälytutkimus keskittyi algoritmeihin ja uusiin malleihin vertailuarvojen voittamiseksi.
mutta jokin tärkeä on muuttanut pelin: "RL vihdoin yleistää."
toimiva "resepti": massiivinen kielen esikoulutus (aiemmat) + asteikko + päättely toimintana RL-silmukan sisällä.
tämän vertailuarvon nousun tulos. Peli muuttuu: ongelmien ratkaisemisesta oikeiden ongelmien määrittelyyn. Arvioinnista tulee keskipiste.
Keskeinen vertailukohta on nyt "hyödyllisyysongelma". Vertailuarvot eivät todellakaan sovellu hyvin todellisiin tehtäviin.
Joten tämä on toisen puoliskon pelikirja: keksi arviointiasetukset, jotka on sidottu todelliseen hyödyllisyyteen; Käytä sitten reseptiä voittaaksesi näiden uusien sääntöjen mukaisesti.
RL:ssä avainkolmikko on ympäristö, algoritmit ja priorit. Olemme viettäneet niin paljon aikaa parhaiden Algojen parissa, mutta Algot sopivat liikaa ympäristöön, jossa he ovat syntyneet.
"Toisella puoliskolla" Arviointi = Ympäristösuunnittelu: Rakenna asetuksia lähemmäs todellisuutta (ihminen-silmukassa, ei-IID, peräkkäinen/muistilla) todellisen hyödyn lisäämiseksi, ei vain vertailuvoittojen saavuttamiseksi.

374
Johtavat
Rankkaus
Suosikit