المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Shane Gu
الجوزاء - RL ، CoT ، تعدد اللغات. كبار الموظفين RS @GoogleDeepMind MTV. 🇯🇵 -ولد 🇨🇳🇨🇦 . على سبيل المثال: @OpenAI (JP: @shanegJP)
Shane Gu أعاد النشر
🚨 الرياضيات الأولمبية + الذكاء الاصطناعي:
قمنا بتشغيل Gemini 2.5 Pro من Google على مشاكل IMO 2025 الجديدة. من خلال المطالبة الدقيقة وتصميم خط الأنابيب ، تم حل 5 من أصل 6 - وهو أمر رائع للمهام التي تتطلب رؤية عميقة وإبداعا.
يمكن للنموذج أن يفوز بالميدالية الذهبية! 🥇
#الذكاء الاصطناعي #Math #LLMs #IMO2025
218.88K
الآسيويون: سنصلح الفوضى الخاصة بنا

Patrick Shen18 يوليو، 03:03
عند إطلاقها ادعى Cluely أنه سيقتل 9 صناعات.
نحن هنا لقتل واحد فقط: الغش.
تعرف على Truely - الأداة مفتوحة المصدر التي تشير إلى المقابلات بمساعدة الذكاء الاصطناعي في الوقت الفعلي. يعمل مع Zoom و Meet و Teams والمزيد.
مستقبل المقابلات عبر الإنترنت هنا.
2.01K
لمحاربة الآسيويين ، تحتاج إلى آسيويين

Patrick Shen18 يوليو، 03:03
عند إطلاقها ادعى Cluely أنه سيقتل 9 صناعات.
نحن هنا لقتل واحد فقط: الغش.
تعرف على Truely - الأداة مفتوحة المصدر التي تشير إلى المقابلات بمساعدة الذكاء الاصطناعي في الوقت الفعلي. يعمل مع Zoom و Meet و Teams والمزيد.
مستقبل المقابلات عبر الإنترنت هنا.
239
لماذا تحتاج فرق ما قبل التدريب وما بعد التدريب إلى التوافق

David Mizrahi18 يوليو، 06:21
متحمس لمشاركة عملنا الجديد: "تتحسن نماذج اللغة عندما تتطابق بيانات التدريب المسبق مع المهام المستهدفة"
نعم ، يبدو الأمر واضحا (وهو كذلك!) ، ولكن عادة ما يحدث هذا بشكل ضمني وغير مباشر: حدد البيانات بشكل حدسي → المعيار → صقلها → تكرارها.
تساءلنا: ماذا يحدث إذا قمنا بمطابقة بيانات التدريب المسبق بشكل صريح مع المعايير؟ والنتيجة هي نهج بسيط ميت ينتج عنه مضاعفات حساب 2x + على خطوط أساس قوية ويعطينا طريقة مبدئية لدراسة كيفية تشكيل الخيارات المعيارية (وتقييدها!) قدرات النموذج.
المكافأة: قوانين القياس الشاملة من تدريب 500+ نموذج تكشف كيف يتطور الاختيار الأمثل للبيانات مع توسع النماذج.
🧵 (1/14)

2.68K
يقوم فريق Grok باستيعاب عمليات البيانات البشرية (على سبيل المثال ، التوظيف لدور مدرس الذكاء الاصطناعي لليابانية). من المحتمل أن تفكر المزيد من المختبرات الحدودية في امتلاك وتشغيل عمالة البيانات.

Koki Ikeda | SoftBank15 يوليو، 22:12
تبحث "xAI" ، التي تقوم بتطوير Grok ، عن مدرس الذكاء الاصطناعي الياباني.
تتضمن الوظيفة تسمية وتعليق على بيانات النص والصوت والفيديو اليابانية. يمكنك العمل عن بعد بالكامل من اليابان ، والأجر بسعر مرتفع بالساعة يعادل المعايير الأمريكية.
🗣️ متحدث أصلي باللغة اليابانية
🧑 💻 جهاز التحكم عن بعد بالكامل
💰 سعر الساعة من 35 إلى 65 دولارا (5200-9600 ين)
🕐 عقد لمدة 6 أشهر (مع إمكانية التمديد)

8.37K
يقوم فريق Grok باستيعاب عمليات البيانات البشرية (على سبيل المثال ، التوظيف لدور مدرس الذكاء الاصطناعي لليابانية). بالنظر إلى انتقال الذكاء الاصطناعي على نطاق واسع ، من المحتمل أن تفكر المزيد من المختبرات الحدودية في امتلاك وتشغيل عمالة البيانات.

Koki Ikeda | SoftBank15 يوليو، 22:12
تبحث "xAI" ، التي تقوم بتطوير Grok ، عن مدرس الذكاء الاصطناعي الياباني.
تتضمن الوظيفة تسمية وتعليق على بيانات النص والصوت والفيديو اليابانية. يمكنك العمل عن بعد بالكامل من اليابان ، والأجر بسعر مرتفع بالساعة يعادل المعايير الأمريكية.
🗣️ متحدث أصلي باللغة اليابانية
🧑 💻 جهاز التحكم عن بعد بالكامل
💰 سعر الساعة من 35 إلى 65 دولارا (5200-9600 ين)
🕐 عقد لمدة 6 أشهر (مع إمكانية التمديد)

325
إذا كنت في ICML ومهتما باللغة المنخفضة أو تعدد اللغات، فيرجى إلقاء التحية على @marafinkels! لقد عملنا عن كثب في الأشهر القليلة الماضية لشحن طريقة RL لإصلاح مشكلة جودة الجوزاء الحرجة. لديها أفكار بحثية رائعة أيضا! نأمل أن تبقى الجوزاء × الأكاديمية على اتصال.

Mara Finkelstein27 نوفمبر 2024
عادة ما يتم تقييم LLMs باستخدام المقاييس التلقائية على مجموعات الاختبار القياسية ، ولكن يتم تطوير المقاييس + مجموعات الاختبار بشكل مستقل. يثير هذا سؤالا حاسما: هل يمكننا تصميم مقاييس تلقائية على وجه التحديد للتفوق في مجموعات الاختبار التي نعطيها الأولوية؟ إجابة: نعم!

5.76K
Shane Gu أعاد النشر
منشور مدونة جديد حول عدم تناسق التحقق و "قانون المدقق":
أصبح عدم تناسق التحقق - فكرة أن التحقق من بعض المهام أسهل بكثير من حلها - فكرة مهمة لأن لدينا RL يعمل أخيرا بشكل عام.
من الأمثلة الرائعة على عدم تناسق التحقق أشياء مثل ألغاز سودوكو ، وكتابة الكود لموقع ويب مثل instagram ، ومشاكل BrowseComp (يستغرق ~ 100 موقع للعثور على الإجابة ، ولكن من السهل التحقق منها بمجرد حصولك على الإجابة).
المهام الأخرى لها شبه تماثل في التحقق ، مثل جمع رقمين مكونة من 900 رقم أو بعض البرامج النصية لمعالجة البيانات. ومع ذلك ، فإن مهام أخرى أسهل بكثير في اقتراح حلول مجدية بدلا من التحقق منها (على سبيل المثال ، التحقق من الحقائق في مقال طويل أو ذكر نظام غذائي جديد مثل "أكل البيسون فقط").
من الأشياء المهمة التي يجب فهمه حول عدم تناسق التحقق أنه يمكنك تحسين عدم التناسق من خلال القيام ببعض الأعمال مسبقا. على سبيل المثال ، إذا كان لديك مفتاح الإجابة لمشكلة رياضية أو إذا كانت لديك حالات اختبار لمشكلة Leetcode. هذا يزيد بشكل كبير من مجموعة المشاكل المتعلقة بعدم تناسق التحقق المرغوب فيه.
ينص "قانون المدقق" على أن سهولة تدريب الذكاء الاصطناعي على حل مهمة ما تتناسب مع مدى إمكانية التحقق من المهمة. سيتم حل جميع المهام التي يمكن حلها ويسهل التحقق منها بواسطة الذكاء الاصطناعي. تتناسب القدرة على تدريب الذكاء الاصطناعي على حل مهمة ما مع ما إذا كانت المهمة تحتوي على الخصائص التالية:
1. الحقيقة الموضوعية: يتفق الجميع على ماهية الحلول الجيدة
2. سريع التحقق: يمكن التحقق من أي حل معين في بضع ثوان
3. قابل للتطوير للتحقق: يمكن التحقق من العديد من الحلول في وقت واحد
4. انخفاض مستوى الضجيج: يرتبط التحقق ارتباطا وثيقا بجودة الحل قدر الإمكان
5. المكافأة المستمرة: من السهل تصنيف جودة العديد من الحلول لمشكلة واحدة
أحد النماذج الواضحة لقانون المدقق هو حقيقة أن معظم المعايير المقترحة في الذكاء الاصطناعي سهلة التحقق وقد تم حلها حتى الآن. لاحظ أن جميع المعايير الشائعة تقريبا في السنوات العشر الماضية تناسب المعايير # 1-4 ؛ المعايير التي لا تفي بالمعايير # 1-4 ستكافح لتصبح شائعة.
لماذا تعتبر قابلية التحقق مهمة جدا؟ يتم تعظيم مقدار التعلم في الذكاء الاصطناعي الذي يحدث عند استيفاء المعايير المذكورة أعلاه ؛ يمكنك اتخاذ الكثير من خطوات التدرج حيث تحتوي كل خطوة على الكثير من الإشارات. تعد سرعة التكرار أمرا بالغ الأهمية - وهذا هو السبب في أن التقدم في العالم الرقمي كان أسرع بكثير من التقدم في العالم المادي.
يعد AlphaEvolve من Google أحد أعظم الأمثلة على الاستفادة من عدم تناسق التحقق. يركز على الإعدادات التي تناسب جميع المعايير المذكورة أعلاه ، وقد أدى إلى عدد من التطورات في الرياضيات والمجالات الأخرى. يختلف عما كنا نفعله في الذكاء الاصطناعي على مدار العقدين الماضيين ، إنه نموذج جديد حيث يتم تحسين جميع المشكلات في بيئة تكون فيها مجموعة القطارات مكافئة لمجموعة الاختبار.
عدم تناسق التحقق موجود في كل مكان ومن المثير التفكير في عالم من الذكاء الخشن حيث سيتم حل أي شيء يمكننا قياسه.

298.73K
العمل المؤثر الذي يمكن لأي شخص القيام به هو استخدام LLMs لتدوين ورقمنة أكبر قدر ممكن من سير العمل ، و CoTs ، والإلهام.
هندسة السياق لأتمتة نفسك وزيادتها في الحياة والعمل.

Thariq15 يوليو، 05:51
المجلات والمهام
لدي بعض الأوامر المخصصة:
/journal الذي سيقوم بإنشاء إدخال دفتر يومية جديد لليوم.
/todos، وهو أمر يسمح لي بإنشاء أمر جديد في DOS أو وضع علامة على الآخرين على أنهم تم. يتم تنظيم المهام حسب الموضوع في الملفات ، على سبيل المثال '
غالبا ما يبحث كلود في التعليمات البرمجية الخاصة بي ومشاريعي وما إلى ذلك لمزيد من السياق عندما أضيف أ للقيام به ، وهو أمر مفيد للغاية.
815
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز