DApp Store | Centrum Web3 pro události a hry

Populární témata

🧵Top 10 otevřených modelů podle poskytovatele Ačkoli proprietární modely jsou často na vrcholu žebříčků, otevřené modely jsou také spárovány v režimu bitvy a umístěny v našich veřejných žebříčcích. Zde je 10 nejlepších při stohování podle nejvyššího otevřeného modelu podle poskytovatele. - #1 Kimi K2 (Modifikovaný MIT) @Kimi_Moonshot - #2 DeepSeek R1 0528 (MIT) @deepseek_ai - #3 Qwen 235b a22b bez přemýšlení (Apache 2.0) @alibaba_qwen - #4 MiniMax M1 (MIT) @minimax_ai - #5 Gemma 3 27b it (Gemma) @googledeepmind - #6 Mistral Small Ultra (Apache 2.0) @mistral_ai - #7 Llama 3.1 Nemotron Ultra 253b v1 (otevřený model Nvidia) @nvidia - #8 Příkaz A (Cohere) @cohere - #9 Lama 4 Maverick Instruovat (Lama 4) @aiatmeta - #10 OLMo 2 32b Instruovat (Apache 2.0) @allen_ai Podívejte se na vlákno, kde se dozvíte něco více o 5 nejlepších v tomto seznamu 👇

Kimi K2 - #1 v otevřené aréně! Pokud jste věnovali pozornost open source modelům, tento nový model od rostoucí společnosti zabývající se umělou inteligencí, Moonshot AI, dělá vlny jako jeden z nejpůsobivějších open-source LLM k dnešnímu dni. Naše komunita nám říká, že se jim také líbí způsob, jakým Kimi K2 reaguje: Kimi je vtipný, aniž by zněl příliš roboticky. Kimi K2 je postaven na architektuře Blend-of-Experts (MoE) s celkem 1 bilionem parametrů, z nichž 32 miliard je aktivních během dané inference. Tato konstrukce pomáhá modelu vyvážit efektivitu a výkon na vyžádání.

Nejlepší otevřený model DeepSeek, DeepSeek R1-0528, se řadí na #2 R1-0528 je vylepšená verze R1 vyladěná instrukcemi a #2 nejlepší model otevřeného chatu podle komunity. Silný ve vícetahovém dialogu a argumentačních úkolech. R1 (základní) je původní, stále pevný, ale nyní mírně zaostává za novějšími variantami ladění. V3-0324 je model MoE s celkovými parametry 236B, ale aktivuje pouze několik odborníků na výzvu. Díky tomu je výkonný a efektivní. Funguje dobře napříč instrukcemi, uvažováním a vícejazyčnými úkoly, ale formát výzvy je zde důležitější než u R1-0528.

Qwen 235b a22b (bez přemýšlení) je nejlepším otevřeným modelem společnosti Alibaba na #3 235B-a22b-no-thinking je surový model bez ladění instrukcí (tedy "bez myšlení"). Je skvělý v generaci a řadí se vysoko mezi komunitu díky své hrubé síle uvažování. Mezi další špičkové otevřené modely s naší komunitou od Alibaby patří: Varianty 32B a 30B-a3b jsou menší, rychlejší alternativy se solidním výkonem, i když zaostávají za modely nejvyšší úrovně. Vzhledem k tomu, že 32B je mezi těmito dvěma hustší, komunita preferuje jeho přesnost před 30B-a3b. 30B-a3b je model MoE, díky kterému je o něco rychlejší. qwq-32b je speciálně navržen tak, aby řešil složité problémy uvažování a jeho cílem je vyrovnat se výkonu větších modelů, jako je DeepSeek R1, ale při testování v reálném světě se tak úplně neprosadí.

MiniMax M1 se dostal na seznam s hodnocením nejlepších modelů na #4 M1 také vyniká svým jedinečným přístupem s architekturou MoE v kombinaci s formou pozornosti nazvanou "Lightning Attention", linearizovaným mechanismem účelově vytvořeným pro vysoce efektivní zpracování tokenů. Tento přístup rozhodně upoutal pozornost naší komunity, protože je opravdu dobrý v dialogu, uvažování a následování pokynů.

Google DeepMind přistane na #5 se svým nejlepším otevřeným modelem, Gemma 3 27b it Gemma 3 je multimodální jazykový model s otevřenou váhou. Gemma 3 zvládne textové i obrazové vstupy a vyniká v uvažování, úlohách s dlouhým kontextem a aplikacích v jazyce vidění. Naše komunita miluje, jak tato Gemma zlepšila efektivitu paměti a zvýšila podporu širšího kontextu oproti předchozím verzím.

31,75K

Top

Hodnocení

Oblíbené

Co je v trendu on-chain

Populární na X

Nejvyšší finanční vklady v poslední době

Nejpozoruhodnější