一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

🧵按提供者排名的前10个开放模型尽管专有模型通常位居榜首，但开放模型也在对战模式中并列，并在我们的公共排行榜上排名。以下是按提供者排名的前10个开放模型。 - #1 Kimi K2（修改版MIT） @Kimi_Moonshot - #2 DeepSeek R1 0528（MIT） @deepseek_ai - #3 Qwen 235b a22b 无思考（Apache 2.0） @alibaba_qwen - #4 MiniMax M1（MIT） @minimax_ai - #5 Gemma 3 27b it（Gemma） @googledeepmind - #6 Mistral Small Ultra（Apache 2.0） @mistral_ai - #7 Llama 3.1 Nemotron Ultra 253b v1（Nvidia开放模型） @nvidia - #8 Command A（Cohere） @cohere - #9 Llama 4 Maverick Instruct（Llama 4） @aiatmeta - #10 OLMo 2 32b Instruct（Apache 2.0） @allen_ai 查看线程以了解此列表中前5名的更多信息 👇

Kimi K2 - 在开放竞技场中排名第一！如果你一直关注开源模型，这款来自新兴人工智能公司 Moonshot AI 的新模型正在引起轰动，成为迄今为止最令人印象深刻的开源 LLM 之一。我们的社区告诉我们，他们也喜欢 Kimi K2 的回应方式：Kimi 幽默而不显得过于机械。 Kimi K2 基于混合专家（MoE）架构构建，总共有 1 万亿个参数，其中 320 亿个在任何给定的推理过程中是活跃的。这种设计帮助模型在效率和按需性能之间取得平衡。

DeepSeek的顶级开放模型，DeepSeek R1-0528，排名第2 R1-0528是R1的精细指令调优版本，根据社区的反馈，它是第二最佳开放聊天模型。擅长多轮对话和推理任务。 R1（基线）是原始版本，仍然稳固，但现在略微落后于更新的调优变体。 V3-0324是一个MoE模型，具有236B的总参数，但每个提示仅激活少数专家。这使得它既强大又高效。它在指令、推理和多语言任务中表现良好，但提示格式在这里比R1-0528更为重要。

Qwen 235b a22b（无思考）是阿里巴巴的顶级开放模型，排名第3 235B-a22b-无思考是一个没有经过指令调优的原始模型（因此称为“无思考”）。它在生成方面表现出色，并因其原始推理能力而在社区中排名靠前。阿里巴巴与我们社区的其他一些顶级开放模型包括： 32B和30B-a3b变体是更小、更快的替代品，性能稳定，尽管它们落后于顶级模型。由于32B在两者中更为密集，社区更喜欢它的准确性而非30B-a3b。30B-a3b是一个MoE模型，使其速度稍快。 qwq-32b专门设计用于解决复杂的推理问题，旨在与像DeepSeek R1这样的大型模型的性能相匹配，但在实际测试中未能达到该标准。

MiniMax M1 以其顶级型号排名第 4 名而上榜。 M1 还因其独特的 MoE 架构与一种称为 "Lightning Attention" 的注意力形式相结合而脱颖而出，这是一种专为高效令牌处理而设计的线性机制。这种方法确实引起了我们社区的关注，因为它在对话、推理和遵循指令方面表现得非常出色。

谷歌DeepMind以其顶级开放模型Gemma 3 27b位列第5 Gemma 3是一个开放权重的多模态语言模型。Gemma 3可以处理文本和图像输入，在推理、长上下文任务和视觉语言应用方面表现出色。我们的社区喜欢这个Gemma如何提高了内存效率，并增加了对比之前版本更大上下文的支持。

31.74K