المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
تطلق DeepSeek V3.1 ، وتوحيد V3 و R1 في نموذج تفكير هجين مع زيادة تدريجية في الذكاء
زيادة الذكاء التدريجي: تظهر نتائج القياس الأولية ل DeepSeek V3.1 مؤشر ذكاء التحليل الاصطناعي البالغ 60 في وضع التفكير ، ارتفاعا من درجة R1 البالغة 59. في الوضع غير المنطقي ، يحقق V3.1 درجة 49 ، وهي زيادة أكبر عن درجة V3 0324 السابقة البالغة 44. هذا يترك V3.1 (المنطق) وراء أحدث Qwen3 235B 2507 من Alibaba (المنطق) - لم يستعيد DeepSeek الصدارة.
التفكير الهجين: انتقل @deepseek_ai إلى نموذج التفكير الهجين لأول مرة - يدعم كلا من أوضاع التفكير وغير المنطقي. يحاكي انتقال DeepSeek إلى نموذج التفكير الهجين الموحد النهج الذي اتبعه OpenAI و Anthropic و Google. ومع ذلك ، من المثير للاهتمام أن نلاحظ أن Alibaba تخلت مؤخرا عن نهجها الهجين الذي فضلوه ل Qwen3 من خلال إصداراتها المنفصلة من نماذج التفكير وتوجيه Qwen3 2507.
استدعاء الوظيفة / استخدام الأداة: بينما يدعي DeepSeek تحسين استدعاء الوظيفة للنموذج ، لا يدعم DeepSeek V3.1 استدعاء الوظيفة عندما يكون في وضع التفكير. من المحتمل أن يحد هذا بشكل كبير من قدرته على دعم مهام سير العمل الوكيلة مع متطلبات الاستخبارات، بما في ذلك وكلاء الترميز.
استخدام الرمز المميز: يسجل DeepSeek V3.1 درجات أعلى بشكل متزايد في وضع التفكير من DeepSeek R1 ، ويستخدم عددا أقل قليلا من الرموز المميزة عبر الرموز التي نستخدمها لمؤشر ذكاء التحليل الاصطناعي. في الوضع غير المنطقي ، يستخدم رمزا أكثر قليلا من V3 0324 - ولكن لا يزال أقل بعدة مرات مما كان عليه في وضع التفكير الخاص به.
واجهة برمجة التطبيقات: تخدم واجهة برمجة تطبيقات الطرف الأول من DeepSeek الآن نموذج DeepSeek V3.1 الجديد على كل من نقاط نهاية الدردشة والتفكير - ببساطة تغيير ما إذا كان الرمز المميز للتفكير النهائي </think> قد تم توفيره للنموذج في قالب الدردشة للتحكم في ما إذا كان النموذج سيتفكير.
الهندسة المعمارية: DeepSeek V3.1 مطابق من الناحية المعمارية لطرازات V3 و R1 السابقة ، مع معلمات إجمالية تبلغ 671B و 37B معلمات نشطة.
الآثار: ننصح بتوخي الحذر عند وضع أي افتراضات حول ما يعنيه هذا الإصدار حول تقدم DeepSeek نحو نموذج مستقبلي يشار إليه في الشائعات باسم V4 أو R2. نلاحظ أن DeepSeek أصدرت سابقا النموذج النهائي المبني على بنية V2 الخاصة بها في 10 ديسمبر 2024 ، قبل أسبوعين فقط من إطلاق V3.


70.79K
الأفضل
المُتصدِّرة
التطبيقات المفضلة