في الماضي ، ذهب الجميع يائسا إلى السحابة ، لكن تكلفة طاقة حوسبة الوحدة في مرحلة الاستدلال جعلت العديد من الفرق تدرك أن استدلال الذكاء الاصطناعي طويل الأجل على نطاق واسع يحرق الأموال بسرعة كبيرة جدا على السحابة. تعد تطبيقات الذكاء الاصطناعي الأصلية أكثر ملاءمة لغرق مهام الاستدلال الهامة في مراكز البيانات المحلية، مما يقلل من زمن الوصول ويوفر تكاليف عرض النطاق الترددي وتأجير السحابة كان القتال من أجل الذاكرة سمة نموذجية في الأيام الأولى للتدريب على التعلم العميق (كل من لديه ذاكرة أكثر يفوز) ، ولكن اليوم: يؤثر حد الإنتاجية المخزنة في وحدة معالجة الرسومات بشكل مباشر على الاستدلال QPS سرعة التفاعل بين وحدة معالجة الرسومات ووحدة المعالجة المركزية / بطاقة التسريع هي الحد الأعلى لأداء خط الأنابيب يمكن أن يصل استهلاك الطاقة لمجموعة الذكاء الاصطناعي أحادية الرف إلى عشرات الكيلووات ، وسيؤدي تصميم PD غير المعقول إلى تجميد نطاق نشر طاقة الحوسبة بشكل مباشر إذا ظل تخطيط مركز البيانات عالقا في نموذج التصميم لأعمال الويب / قاعدة البيانات التقليدية في عام 2015 ، إلغاؤه في ظل أعباء عمل الذكاء الاصطناعي تحقق من رؤيتنا: 20 خبيرا تقنيا حول اتجاهات الأجهزة الناشئة التي يجب على الشركات مشاهدتها عبر @forbes
‏‎10.45‏K