Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nathan Lambert
Zjišťování AI @allen_ai, otevřených modelů, RLHF, dolaďování atd
Kontakt prostřednictvím e-mailu.
Píše @interconnectsai
Napsal knihu RLHF
Horský běžec
pro vaši zábavu :)

AI EngineerPřed 19 h
🆕 Vydáváme celou naši skladbu RL + Reasoning!
mající novou vlastnost:
• @willccbb, prvotní intelekt
• @GregKamradt, Arc Prize
• @natolambert, AI2/propojení
• @corbtt, OpenPipe
• @achowdhery, reflexe
• @ryanmart3n, na zakázku
• @ChrSzegedy, Morfing
se speciálním 3 hodinovým workshopem od:
@danielhanchen nelenivosti!
Začněte zde:
Krásný víkend sledování! A děkujeme @OpenPipeAI za podporu a hostování této skladby!

853
Smyslem toho je vyhnout se psyops, ne odvádět pozornost od zřejmého, velkého technického úspěchu, no tak, fam, nejsem nenávistník AI
tolik nenávistníků v odpovědích

Nathan Lambert19. 7. 21:23
Nepodlehnout nejasným příspěvkům OpenAI o novém zlatém modelu IMO s "univerzálním RL" a čemkoli dalším "průlomovým". Google také získal zlato IMO (těžší než zvládnutí AIME), ale pamatujte, že jednoduché nápady se nejlépe škálují.
10,31K
Nathan Lambert repostoval/a
Dosáhla OpenAI s tímto experimentálním modelem RL s velmi dlouhými epizodami?
Snímek obrazovky z článku @natolambert na téma "Co bude dál s posilovaným učením".
Nathan v tomto článku říká: Tam, kde současné metody generují 10K-100K tokenů na odpověď pro matematické nebo kódové problémy během tréninku, druh problémů, o kterých lidé diskutují při aplikaci tréninku RL nové generace, by byl 1M-100M tokenů na odpověď. To zahrnuje zabalení několika inferenčních volání, výzev a interakcí s prostředím v rámci jedné epizody, na základě které jsou zásady aktualizovány.
Možná je tento průlom kombinací obojího - velmi dlouhé epizody RL a škálování TTC na 1M-100M tokenů na odpověď!

8,5K
Hahahahahahaha, top modely US Open jsou Gemma 3 27b a @nvidia's finetune of Llama 3.1


lmarena.ai17. 7. 23:21
🚨 BREAKING: @Kimi_Moonshot Kimi-K2 je nyní #1 otevřeným modelem v aréně!
S více než 3 tisíci hlasy komunity se celkově řadí na #5 a předbíhá DeepSeek jako nejlepší otevřený model.
Obrovská gratulace týmu Moonshot k tomuto působivému milníku! Žebříček nyní obsahuje 7 různých poskytovatelů v top 15 - nejkonkurenceschopnější, jaký kdy byl.
Další postřehy ve vlákně 🧵

25,24K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější