Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🧵Top 10 otevřených modelů podle poskytovatele
Ačkoli proprietární modely jsou často na vrcholu žebříčků, otevřené modely jsou také spárovány v režimu bitvy a umístěny v našich veřejných žebříčcích.
Zde je 10 nejlepších při stohování podle nejvyššího otevřeného modelu podle poskytovatele.
- #1 Kimi K2 (Modifikovaný MIT) @Kimi_Moonshot
- #2 DeepSeek R1 0528 (MIT) @deepseek_ai
- #3 Qwen 235b a22b bez přemýšlení (Apache 2.0) @alibaba_qwen
- #4 MiniMax M1 (MIT) @minimax_ai
- #5 Gemma 3 27b it (Gemma) @googledeepmind
- #6 Mistral Small Ultra (Apache 2.0) @mistral_ai
- #7 Llama 3.1 Nemotron Ultra 253b v1 (otevřený model Nvidia) @nvidia
- #8 Příkaz A (Cohere) @cohere
- #9 Lama 4 Maverick Instruovat (Lama 4) @aiatmeta
- #10 OLMo 2 32b Instruovat (Apache 2.0) @allen_ai
Podívejte se na vlákno, kde se dozvíte něco více o 5 nejlepších v tomto seznamu 👇

Kimi K2 - #1 v otevřené aréně!
Pokud jste věnovali pozornost open source modelům, tento nový model od rostoucí společnosti zabývající se umělou inteligencí, Moonshot AI, dělá vlny jako jeden z nejpůsobivějších open-source LLM k dnešnímu dni. Naše komunita nám říká, že se jim také líbí způsob, jakým Kimi K2 reaguje: Kimi je vtipný, aniž by zněl příliš roboticky.
Kimi K2 je postaven na architektuře Blend-of-Experts (MoE) s celkem 1 bilionem parametrů, z nichž 32 miliard je aktivních během dané inference. Tato konstrukce pomáhá modelu vyvážit efektivitu a výkon na vyžádání.
Nejlepší otevřený model DeepSeek, DeepSeek R1-0528, se řadí na #2
R1-0528 je vylepšená verze R1 vyladěná instrukcemi a #2 nejlepší model otevřeného chatu podle komunity. Silný ve vícetahovém dialogu a argumentačních úkolech.
R1 (základní) je původní, stále pevný, ale nyní mírně zaostává za novějšími variantami ladění.
V3-0324 je model MoE s celkovými parametry 236B, ale aktivuje pouze několik odborníků na výzvu. Díky tomu je výkonný a efektivní. Funguje dobře napříč instrukcemi, uvažováním a vícejazyčnými úkoly, ale formát výzvy je zde důležitější než u R1-0528.
Qwen 235b a22b (bez přemýšlení) je nejlepším otevřeným modelem společnosti Alibaba na #3
235B-a22b-no-thinking je surový model bez ladění instrukcí (tedy "bez myšlení").
Je skvělý v generaci a řadí se vysoko mezi komunitu díky své hrubé síle uvažování.
Mezi další špičkové otevřené modely s naší komunitou od Alibaby patří:
Varianty 32B a 30B-a3b jsou menší, rychlejší alternativy se solidním výkonem, i když zaostávají za modely nejvyšší úrovně. Vzhledem k tomu, že 32B je mezi těmito dvěma hustší, komunita preferuje jeho přesnost před 30B-a3b. 30B-a3b je model MoE, díky kterému je o něco rychlejší.
qwq-32b je speciálně navržen tak, aby řešil složité problémy uvažování a jeho cílem je vyrovnat se výkonu větších modelů, jako je DeepSeek R1, ale při testování v reálném světě se tak úplně neprosadí.
MiniMax M1 se dostal na seznam s hodnocením nejlepších modelů na #4
M1 také vyniká svým jedinečným přístupem s architekturou MoE v kombinaci s formou pozornosti nazvanou "Lightning Attention", linearizovaným mechanismem účelově vytvořeným pro vysoce efektivní zpracování tokenů.
Tento přístup rozhodně upoutal pozornost naší komunity, protože je opravdu dobrý v dialogu, uvažování a následování pokynů.
Google DeepMind přistane na #5 se svým nejlepším otevřeným modelem, Gemma 3 27b it
Gemma 3 je multimodální jazykový model s otevřenou váhou. Gemma 3 zvládne textové i obrazové vstupy a vyniká v uvažování, úlohách s dlouhým kontextem a aplikacích v jazyce vidění. Naše komunita miluje, jak tato Gemma zlepšila efektivitu paměti a zvýšila podporu širšího kontextu oproti předchozím verzím.
31,75K
Top
Hodnocení
Oblíbené