هذا هو بالضبط سبب أهمية خطوط الأنابيب البشرية في الحلقة في المستقبل المنظور ، مع ارتفاع تعقيد المهمة والأفق ، تنخفض معدلات النجاح بشكل كبير. ستحتاج إلى البشر لتأسيس العملية باستمرار من أجل الحفاظ على معدلات النجاح. المشكلات الرئيسية في مناهج HITL هي: 1. أصبحت LLMs المضبوطة جيدة جدا لدرجة يصعب على البشر تقييم ما إذا كانت المخرجات تلبي بالفعل المتطلبات الموضوعية لأن الكثير من العمل قد تم بذله لجعلها "تبدو جيدة". 2. معرفة متى يجب على الإنسان التدخل أو متى يجب على الوكيل / النموذج تسليم المهمة / التقييم. اكتشاف الهلوسة هو أحد الجحيم من الموضوع
Benjamin Todd
Benjamin Todd‏16 يونيو 2025
لماذا يمكن للذكاء الاصطناعي البرمجة لمدة 1 ساعة وليس 10 ساعات؟ تفسير بسيط: إذا كانت هناك فرصة بنسبة 10٪ للخطأ لكل خطوة 10 دقائق (على سبيل المثال) ، فإن معدل النجاح هو: 1 ساعة: 53٪ 4 ساعات: 8٪ 10 ساعات: 0.002٪ اختبرت @tobyordoxford نظرية "معدل الخطأ الثابت" هذه وأظهرت أنها مناسبة تماما للبيانات فرصة النجاح تنخفض بشكل كبير
‏‎1.29‏K