Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
2023: presso OpenAI, alcune figure chiave nel post-addestramento erano contrarie alla scalabilità del RL.
2022: Eric/Yuhuai (ora xAI) ha scritto STaR e io ho scritto "LLM può auto-migliorarsi". Era chiaro che il RL su segnali puliti sblocca il prossimo salto.
La divisione pre/post-addestramento potrebbe essere stata un grande rallentamento per l'IA.

34,74K
Principali
Ranking
Preferiti