المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
منشور جيد من @balajis حول "فجوة التحقق".
يمكنك أن ترى أنه يوجد وضعان في الإنشاء. استعارة مصطلحات GAN:
1) التوليد و
2) التمييز.
على سبيل المثال الرسم - تقوم بعمل ضربة فرشاة (1) ثم تبحث لفترة من الوقت لمعرفة ما إذا كنت قد قمت بتحسين اللوحة (2). تتخللها هاتان المرحلتان في جميع الأعمال الإبداعية تقريبا.
النقطة الثانية. يمكن أن يكون التمييز صعبا للغاية من الناحية الحسابية.
- الصور هي الأسهل إلى حد بعيد. على سبيل المثال ، يمكن لفرق إنشاء الصور إنشاء شبكات عملاقة من النتائج لتحديد ما إذا كانت إحدى الصور أفضل من الأخرى. شكرا لك على وحدة معالجة الرسومات العملاقة في عقلك المصممة لمعالجة الصور بسرعة كبيرة.
- النص أصعب بكثير. إنه قابل للتقشط ، ولكن عليك أن تقرأه ، إنه دلالي ومنفصل ودقيق ، لذا عليك أيضا التفكير (خاصة في التعليمات البرمجية على سبيل المثال).
- ربما يكون الصوت أصعب من IMO ، لأنه يفرض محورا زمنيا بحيث لا يمكن حتى التقشط. أنت مجبر على إنفاق الحوسبة التسلسلية ولا يمكنك موازاتها على الإطلاق.
يمكنك القول أنه في الترميز ، انهارت LLMs (1) إلى ~ instant، لكنها لم تفعل سوى القليل جدا لمعالجة (2). لا يزال يتعين على الشخص التحديق في النتائج والتمييز إذا كانت جيدة. هذا هو انتقادي الرئيسي لترميز LLM من حيث أنهم يبصقون بشكل عرضي * طريقة * الكثير من التعليمات البرمجية لكل استعلام بتعقيد تعسفي ، متظاهرين بعدم وجود مرحلة 2. الحصول على هذا القدر من التعليمات البرمجية أمر سيء ومخيف. بدلا من ذلك ، يجب على LLM العمل معك بنشاط لتقسيم المشكلات إلى خطوات تدريجية صغيرة ، يمكن التحقق من كل منها بسهولة أكبر. يجب أن تتوقع العمل الحسابي ل (2) وتقليلها قدر الإمكان. يجب أن تهتم حقا.
يقودني هذا إلى أكبر سوء فهم لغير المبرمجين حول الترميز. يعتقدون أن الترميز يتعلق بكتابة الكود (1). إنه ليس. يتعلق الأمر بالتحديق في الكود (2). تحميل كل ذلك في ذاكرتك العاملة. يسير ذهابا وإيابا. التفكير في جميع حالات الحافة. إذا أمسكت بي في نقطة عشوائية أثناء "البرمجة" ، فمن المحتمل أنني أحدق في الشاشة ، وإذا تمت مقاطعتي ، فأنا غاضب حقا لأنها شاقة من الناحية الحسابية. إذا حصلنا على 1 أسرع بكثير ، لكننا لم نقم أيضا بتقليل 2 (وهو في معظم الأوقات!) ، فمن الواضح أن السرعة الإجمالية للترميز لن تتحسن (انظر قانون Amdahl).

4 يونيو 2025
الذكاء الاصطناعي مطالبة → التحقق الذكاء الاصطناعي
يطالب الذكاء الاصطناعي بمقاييس ، لأن المطالبة هي مجرد كتابة.
لكن التحقق من الذكاء الاصطناعي لا يتوسع، لأن التحقق من مخرجات الذكاء الاصطناعي ينطوي على أكثر بكثير من مجرد الكتابة.
في بعض الأحيان يمكنك التحقق بالعين ، وهذا هو السبب في أن الذكاء الاصطناعي رائع للواجهة الأمامية والصور والفيديو. ولكن بالنسبة لأي شيء دقيق ، تحتاج إلى قراءة الكود أو النص بعمق - وهذا يعني معرفة الموضوع جيدا بما يكفي لتصحيح الذكاء الاصطناعي.
يدرك الباحثون هذا جيدا ، ولهذا السبب هناك الكثير من العمل على الهلوسة.
ومع ذلك ، فإن مفهوم التحقق باعتباره عنق الزجاجة لمستخدمي الذكاء الاصطناعي لم تتم مناقشته بشكل كاف. نعم ، يمكنك تجربة نماذج التحقق الرسمية ، أو نماذج النقاد حيث يتحقق أحد الذكاء الاصطناعي من الآخر ، أو تقنيات أخرى. لكن حتى أن تكون على دراية بالقضية كمشكلة من الدرجة الأولى هو نصف المعركة.
للمستخدمين: التحقق من الذكاء الاصطناعي لا يقل أهمية عن مطالبة الذكاء الاصطناعي.
449.29K
الأفضل
المُتصدِّرة
التطبيقات المفضلة