🚨 عاجل: جامعة ستانفورد نشرت للتو أكثر ورقة غير مريحة حول منطق الماجستير في القانون الكبير. يظهر تفكيرا منهجيا لأسباب استمرار فشل نماذج اللغة الكبيرة، حتى عندما تقول لوحات المتصدرين إنها مثالية. قسموا التفكير إلى جزئين: غير متجسد (رياضيات، منطق، حس سليم) ومتجسد (العالم المادي).. وتظهر نفس الفشل في كل مكان. واحدة من أكثر النتائج إزعاجا هي مدى تكرار إنتاج النماذج لأسباب غير مخلصة.. النماذج ستعطيك الإجابة النهائية الصحيحة، لكن شرحهم ملفق تماما أو خاطئ منطقيا. إنه يدربنا حرفيا على الوثوق بعملية اتخاذ قرار مزيفة.. كما أنها تعاني من أعطال معمارية أساسية (انهيار تحت منطق الضوء) وفشل في المتانة (تغيير كلمة واحدة في الرسالة يقلب الإجابة بالكامل). والتفكير المتجسد؟ والأسوأ من ذلك. نماذج اللغة الكبيرة لا تحتوي على أي تأريض فيزيائي، لذا فهي تفشل في الفيزياء الأساسية بشكل متوقع. الخلاصة: نماذج اللغة الكبيرة تدل على أنها مقنعة فقط، لكنها ليست كافية لتكون موثوقة. نحن ننشر أنظمة تجتاز المعايير لكنها تفشل بصمت في الإنتاج.