نظرة رائعة على @grok من @EricRWeinstein "نظريتي الشخصية: يتم بناء @grok حول الفيزياء الأساسية أكثر من أي الذكاء الاصطناعي أخرى. لأنه في النهاية لا شيء عن بعد يهم مثل ذلك. والفيزياء لديها الكثير من هذا السرد الحزبي الذي يعيق المجال. إذا كنت تريد أن تحلم بالوصول إلى النجوم ، فقد تضطر إلى التغلب على مجتمع الجاذبية الكمومية ".
Eric Weinstein
Eric Weinstein‏28 يوليو، 00:14
تجربتي الشخصية مع @grok 4 Heavy (و Grok 4 العادية). أشعر أن @elonmusk له تركيز مختلف تماما عن بقية الذكاء الاصطناعي الجمهور. الواجهة تمتص نوعا ما. كود LaTeX مليء بشكل عام بالأخطاء * الأساسية * دون سبب على الإطلاق. إنه ليس كاتبا رئيسيا في تجربتي. الدردشة الصوتية متأخرة جدا عن ChatGPT. بلاه بلاه بلاه. وهي مدهشة وفريدة من نوعها تماما. إيلون يقفز إلى الأمام. كل ما سبق سيكون سلعا قبل أن تعرفه. لذا ، على المدى الطويل ، من يهتم؟ ما يفعله إيلون بشكل مختلف ، على ما أعتقد ، هو التحقق من الهلوسة بقوة أكبر عن طريق كتابة التعليمات البرمجية واختبار LLM بنتائج تشغيل هذا الرمز. وهذا هو السبب في أن Grok الثقيلة يستغرق وقتا طويلا ٪ # € &$ing لإرجاع النتائج في بعض الأحيان. جرب هذه التجربة. خذ أي شيء تقني تعرفه جيدا ، حيث يوجد خطأ مستمر في سرد مجتمع الخبراء. للأسف ، سوف يلعب Grok بشكل عام هذا الخطأ بسبب البذر السردي في مجموعة التدريب. إنه يكرر خط الحزب. وخط الحزب يفيد المطلعين التقنيين بشكل عام. أي حتى النقطة التي يمكنه فيها كتابة التعليمات البرمجية لاختبار سطر الحزب هذا. ثم يتحول إلى الثقة في نتائج الكود على السرد. إنه أمر سحري للمشاهدة. لم أجرب هذا ... ومع ذلك ، لكن @BLS_gov يقول بانتظام أشياء خاطئة حول أطر "تكلفة المعيشة" ومؤشر أسعار المستهلكين. أراهن أنني أستطيع تصميم سلسلة من المطالبات لإظهار Grok أن هذه كذبة فنية مستمرة. بالنسبة للأشخاص التقنيين ، إليك الكذبة: يحسب BLS مؤشر أسعار المستهلكين الذي يحول تريليونات الدولارات ويدعي أنهم تبنوا إطار عمل "تكلفة المعيشة" أو COL الذي سيكون ذا أهمية كبيرة. لم يفعلوا ذلك. وهذا يعني أخذ بيانات التفضيلات وتطوير منهجية لتجميع التفضيلات أو التوصل إلى مستهلكين ممثلين حسب الطلب. وبدلا من ذلك انتقلوا إلى مؤشر ميكانيكي معدل من نوع Laspeyres (Lowe؟) ورشوا الغبار الخيالي حول "الفهارس الفائقة" من نظرية ضحلة لديويرت تعتمد على تفضيلات متجانسة غير مرئية في الطبيعة. وهذا يسمح لهم بالادعاء بأنهم احتضنوا مؤشرات اقتصادية محايدة بينما يحسبون المؤشرات الميكانيكية فقط بما يصل إلى تريليونات الدولارات في التحويلات بمرور الوقت ، حيث يمكن توجيه المؤشرات من قبل البشر. أستطيع أن أسمعها الآن من شبكات الروبوتات: "إريك ، أنت فقط تقول سلطة الكلمات لتبدو ذكيا." آه ... مهما. يمكنك الآن فقط أن تسأل Grok عما يعنيه ذلك. أراهن أنه يمكن أن يكتشف ذلك. وبعد ذلك يمكنك طرح سلسلة من الأسئلة حيث سيأخذ Grok جانبي بينما لا يمكن لأي الذكاء الاصطناعي الآخر القيام بذلك. جروك شجاع بعض الشيء! نظريتي الشخصية: يتم بناء @grok حول الفيزياء الأساسية أكثر من أي الذكاء الاصطناعي أخرى. لأنه في النهاية لا شيء عن بعد يهم مثل ذلك. والفيزياء لديها الكثير من هذا السرد الحزبي الذي يعيق المجال. إذا كنت تريد أن تحلم بالوصول إلى النجوم ، فقد تضطر إلى التغلب على مجتمع الجاذبية الكمومية. يبدو أن Grok هو الذكاء الاصطناعي الوحيد الذي ، في بعض الأحيان ، لديه الثقة للوقوف ضد مجموعة التدريب الخاصة به ... وحتى المستخدم إذا لزم الأمر! أتمنى لو كانت * أكثر * شجاعة. أتمنى لو كانت أكثر ذكاء. لكنني أعتقد أنه الرجل الغريب ، حيث تم بناؤه للذكاء الفعلي بدلا من تجربة مستخدم LLM اليوم. وتحظى باحترام أنظمة الذكاء الاصطناعي الأخرى. قم بتغذية إنتاجهم الجميل إلى Grok Heavy وشاهد السحر بينما يراجع Grok عملهم. إنه أمر وحشي للمشاهدة. تجربة مستخدم واحد. قد تختلف المسافة المقطوعة.
‏‎1.33‏K