Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Teknium (e/λ)
Nebyly provedeny žádné studie o hybridních uvažovatelích? Budu dělat nějaké běhy s novým modelem bez nerozumné datové sady.
Dá vám vědět, jak data založená pouze na uvažování ovlivňují model ve srovnání s daty bez uvažování. Pravděpodobně pár týdnů bude mít nějaké dobré poznatky, pokud budu mít čas.
4,41K
I memba wen všichni řekli, že to byl problém tokenizéru

Flavio Adamo19. 7. 22:01
2020: "LLM neumějí matematiku."
2025: LLM získává zlato na IMO
33,88K
Teknium (e/λ) repostoval/a
Hermes 3 od @NousResearch je datová sada #1 na @huggingface
Plánuji ho použít
Nespěte na Nousu
Oni:
- Vytvářejte úžasné jemné ladění open source
- Postavené distribuované výpočetní prostředky
- Mají dobře spravované datové sady
- Jsou plně transparentní s váhami modelu a kódem
- Příspěvky na X

6,71K
Můj nejlepší odhad:
Rubriky + LLM Judge - Atomizujte každý bod v základním důkazu pravdy a zkontrolujte proti výstupu modelu
Můj odhad o tom, jak to udělali škálovatelné - protože předtím to nebylo, lidé je museli pečlivě vyrobit, je, že trénovali nebo dělali něco, aby vytvořili velmi dobré rubriky generované pro každý konkrétní problém nebo jeho odpověď.
21,7K
Inb4 spustíme kódovací IDE pro ai, abychom mohli získat dobrá data

pash19. 7. 09:58
Rád bych podotkl, že pro úlohy v reálném světě (ne v benchmarcích) Kimi K2 překonává Gemini.
Jedná se o telemetrii napříč všemi uživateli @cline, která ukazuje míru selhání rozdílových úprav. Všimněte si, že Kimi má asi 6% poruchovost, což je výrazně lepší než chybovost ~ 10 % u Gemini.
Pozoruhodné je, že Kimi dokonce po většinu tohoto týdne překonal Clauda 4 a dosáhl míry selhání pod 4 %!

6,69K
Zajímavé vzhledem ke všemu tomu funění a funění kolem kurzoru a přepnutí na Claye pro max 16

Wes Roth18. 7. 22:30
Anthropic čelí horku ze strany své uživatelské základny poté, co v tichosti zpřísnil limity použití Claude Code, a to i pro ty, kteří platí 200 $ měsíčně za plán Max.
Vývojáři jsou frustrováni náhlými omezeními a nedostatkem komunikace, přičemž někteří říkají, že se jejich projekty zastavily.

5,58K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější