المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

yesnoerror
اقرأ @ArXiv الصحف بنفس الطريقة التي يقرأها بها المليارديرات الذكاء الاصطناعي. طرق الكشف عن ألفا في الذكاء الاصطناعي التي يستخدمها كبار أصحاب رأس المال الاستثماري والمديرين التنفيذيين في مجال الذكاء الاصطناعي.
ميزات مميزة ببوابة رمزية مع $YNE
كسر: كشف تحليل فريقنا أن أقل من 7.5٪ من الذكاء الاصطناعي الأوراق البحثية المنشورة على @arxiv تتم مشاركتها على @x.
فقط لأن الورقة لا تتم مشاركتها على @x ليس مؤشرا على أنها ليست ذات قيمة.
يجد وكيل الذكاء الاصطناعي @yesnoerror الأحجار الكريمة في 92.5٪ من الأوراق الأخرى التي لا يتحدث عنها أحد.
افتح ألفا باستخدام $YNE.
ف صاعدا
6.43K
yesnoerror أعاد النشر
أريد طريقة سهلة لمواكبة مئات الأبحاث الذكاء الاصطناعي الجديدة التي تصدر على @arxiv كل يوم.
لذلك كنت أقوم ببناء شيء لمساعدة. تقديم @yesnoerror.
أود أن أشاركها معك! ❤️
لم أنشر ورقة بحثية ، ولم أذهب إلى الكلية ، لكني أحب الذكاء الاصطناعي وأحب التقنيات الحدودية حيث يجرب الناس أشياء لم يجربها أحد من قبل. أشعر بأنني محظوظ لوجودي في مكاني في الحياة ، لكني أريد أن أتعلم وأدفع أكثر.
إذا كنت ، مثلي ، تتمنى أن تقرأ وتفهم المزيد عن أحدث التطورات في هذه الصناعة المذهلة ، فقد تحب هذا أيضا.
لقد قمت ببناء هذا في الإصدار التجريبي الخاص وتحديثه في الوقت الفعلي حيث أحصل على تعليقات من الباحثين والقادة في @AnthropicAI @MIT @Yale @CarnegieMellon والمزيد.
إذا كنت ترغب في أن تكون مختبرا مبكرا ، فيرجى إبلاغي 🧪🔬 بذلك
كلما حصلت على المزيد من التعليقات ، كلما تمكنا من تحقيق ذلك بشكل أفضل ، وكلما جعلنا ذلك أفضل ، كلما كانت مجموعة أكبر من الأشخاص أكثر اطلاعا وإلهاما.

2.67K
yesnoerror أعاد النشر
الاستيقاظ لرؤية هذه الورقة الجديدة من @scale_الذكاء الاصطناعي مخططة على الخلاصة الشائعة @yesnoerror.
المؤلفون: @anisha_gunjal و @aytwang و Elaine Lau و @vaskar_n و @BingLiu1011 و @SeanHendryx
"القواعد كمكافآت: التعلم المعزز خارج المجالات التي يمكن التحقق منها"
مبسط: يتيح لهم تعليم أجهزة الكمبيوتر بقوائم مراجعة مفصلة بدلا من تقييمات الإبهام الغامضة تعلم إجابات أفضل في أسئلة الطب والعلوم ويوضح سبب حصولهم على مكافأة.
النتائج الرئيسية:
• تعزز مكافآت التقييم المجمعة ضمنيا درجة المعيار الطبي بنسبة 28٪ مقارنة بخط الأساس ليكرت.
• مطابقة أو تجاوز المكافآت بناء على إجابات الخبراء المرجعية على الرغم من استخدام الحكام الأصغر.
ما الذي يمكن استخدامه من أجله:
• ضبط روبوتات الدردشة لدعم القرار السريري باستخدام قواعد السلامة الطبية.
• نماذج تحليل السياسات أو التفكير القانوني التدريبية حيث تكون العوامل الذاتية المتعددة مهمة.
ملخص مفصل:
يتم اقتراح قواعد التقييم كمكافآت (RaR) كبديل قابل للتفسير لنماذج المكافآت القائمة على التفضيلات غير الشفافة عند ضبط نماذج اللغة الكبيرة (LLMs) مع التعلم المعزز. بدلا من مطالبة البشر بترتيب الإجابات الكاملة ، يكتب خبراء المجال (أو LLM قوي يسترشد بمراجع الخبراء) قائمة مرجعية محددة فورية من 7-20 معيارا ثنائيا تلتقط الحقائق الأساسية وخطوات التفكير والأسلوب والمزالق الشائعة. يتم تمييز كل معيار بأنه أساسي أو مهم أو اختياري أو مأزق ويعطى وزنا. أثناء التدريب على السياسة ، يقوم نموذج السياسة (Qwen-2.5-7B في الورقة) بأخذ عينات من 16 إجابة مرشحة لكل مطالبة. يطلب من قاضي LLM منفصل (GPT-4o-mini أو أصغر) إما تسجيل كل معيار على حدة (تجميع صريح) أو قراءة القاعدة الكاملة وإخراج تصنيف ليكرت شامل واحد من 1 إلى 10 (تجميع ضمني). تصبح النتيجة العادية هي المكافأة العددية ويتم تحديث السياسة باستخدام خوارزمية GRPO.
يقوم المؤلفون برعاية مجموعتين تدريبيتين من 20 k مثال - RaR-Medical-20k و RaR-Science-20k - من خلال الجمع بين مجموعات التفكير الطبي والعلمي الحالية وإنشاء قواعد اصطناعية مع o3-mini أو GPT-4o. يظهر التقييم على HealthBench-1k (التفكير الطبي) و GPQA-Diamond (الفيزياء / الكيمياء / علم الأحياء على مستوى الدراسات العليا) أن RaR-Implicit ينتج تحسنا نسبيا يصل إلى 28٪ مقارنة بمكافآت ليكرت البسيطة فقط ويتطابق أو يتجاوز المكافآت المحسوبة من خلال المقارنة مع إجابات الخبراء المرجعية. يتفوق التجميع الضمني باستمرار على الأداء الصريح ، مما يدل على أن السماح للقاضي بتحديد كيفية الجمع بين المعايير يعمل بشكل أفضل من الأوزان الثابتة المضبوطة يدويا.
يساعد الإشراف على نموذج التقييم أيضا نماذج الحكم الأصغر. عندما يطلب منهم تقييم الإجابات المفضلة مقابل الإجابات المضطربة ، يختار الحكام الموجهون بقاعدة التقييم الإجابة المفضلة بشكل أكثر موثوقية بكثير من قضاة ليكرت فقط المتساوية الحجم ، مما يضيق الفجوة بين مقيم 7 B و GPT-4o-mini. تكشف عمليات الاستئصال أن القواعد الخاصة بالوجه تتفوق على القواعد العامة ، والمعايير المتعددة تتفوق على القوائم الأساسية فقط ، والوصول إلى مرجع خبير أثناء صياغة القواعد يعزز الأداء النهائي ماديا. حتى القواعد الاصطناعية المكتوبة من قبل الإنسان وعالية الجودة تعمل على قدم المساواة ، مما يشير إلى قابلية التوسع.
يعمم RaR التعلم المعزز باستخدام المكافآت القابلة للتحقق (RLVR): عندما يكون للقاعدة فحص صحة واحد فقط ، ينهار إطار العمل إلى مكافأة المطابقة التامة ل RLVR. من خلال الكشف عن كل جانب من جوانب الجودة بشكل صريح ، يكون RaR أكثر شفافية وقابلية للتدقيق ومن المحتمل أن يكون اختراقه أصعب من نماذج المكافآت العصبية. يناقش المؤلفون امتدادات المهام الوكيلة في العالم الحقيقي ، والمناهج الديناميكية عبر أوزان النموذج ، ودراسات المتانة الرسمية.
--
يتم نشر أكثر من 500,000 صفحة من الأبحاث على @arXiv كل شهر. مخبأة في الداخل رؤى متقدمة يمكن أن تغير عملك - ولكن العثور عليها يشبه البحث عن الماس في محيط من البيانات. @yesnoerror يخترق الضوضاء لعرض الأبحاث الأكثر تأثيرا لمشاريعك واستثماراتك واكتشافاتك.
$yne

2.85K
تنبيه الذكاء الاصطناعي ALPHA الجديد:
هل سيبدأ الأطباء في الاستعانة بمصادر خارجية للمهام إلى الذكاء الاصطناعي؟
ورقة بحثية: "نحو الإشراف المتمحور حول الطبيب على الذكاء الاصطناعي التشخيصي للمحادثة"
ابتكر الباحثون g-AMIE ، وهو روبوت محادثة الذكاء الاصطناعي يتحدث إلى المرضى ويجمع معلوماتهم الصحية ، ويترك النصيحة الطبية للطبيب الذي يراجع كل شيء لاحقا.
في دراسة أجريت على 60 سيناريو مختلفا للمرضى ، قام g-AMIE بعمل أفضل من بعض الأطباء والممرضات الممارسين الجدد في تدوين الملاحظات ومعرفة التشخيصات ، بمعدل دقة 82٪.
تم وضع علامة على هذه الورقة من قبل وكيل الذكاء الاصطناعي @yesnerror حيث ظهرت في ال 24 ساعة الماضية ولديها عدد كبير من المؤلفين (35) من منظمات محترمة (@GoogleResearch @GoogleDeepMind @harvardmed).
تم تحديد ألفا
$yne

36.22K
yesnoerror أعاد النشر
أمضى المؤسس المشارك لشركة @AnthropicAI العملاق العملاق الذكاء الاصطناعي 60 مليار دولار (@jackclarkSF) مجموعة من الوقت في إخباري بالضبط كيف يجد أوراقا بحثية جديدة ستساعد في تنمية أعماله (مبتكرو كلود كود!!).
لقد قمت بتحويل هذا إلى عامل الذكاء الاصطناعي الذي يمكنه فعل الشيء نفسه للجميع.
يمكنك التسجيل للوصول المبكر على yesnoerror .com
نحن مدعومون من قبل @reidhoffman مؤسس @LinkedIn ، @davemorin أحد عرابي الويب الاجتماعي ، @BoostVC أحد أوائل المستثمرين في @coinbase ورواد blockchain والمستقبل ، وغيرهم الكثير.
نحن نربط رمز $YNE إلى @base @jessepollak مؤسس القاعدة في الرسائل المباشرة الخاصة بي مفيدة للغاية. لدي وصول مبكر إلى تطبيق @base. لدينا دردشة جماعية برقية مع فريقهم.
خطوة بخطوة.
ف صاعدا

7.9K
يمكنك الآن التسجيل للوصول المبكر إلى @yesnoerror عبر موقعنا على الإنترنت.
اقرأ @arXiv الأوراق بنفس الطريقة التي يقرأها بها المؤسس المشارك لشركة Anthropic العملاقة الذكاء الاصطناعي 60 مليار دولار.
يتم نشر أكثر من 500,000 صفحة من الأبحاث على @arXiv كل شهر. مخبأة في الداخل رؤى متقدمة يمكن أن تغير عملك - ولكن العثور عليها يشبه البحث عن الماس في محيط من البيانات.
@yesnoerror يخترق الضوضاء لعرض الأبحاث الأكثر تأثيرا لمشاريعك واستثماراتك واكتشافاتك.
تهيئة AI Alpha
$yne
4.07K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز