المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ramez Naam
مستثمر في المناخ والطاقة النظيفة. مؤلف 5 كتب. الرئيس المشارك للطاقة والبيئة @SingularityU. محاولة بناء عالم أفضل.
Ramez Naam أعاد النشر
كانت الورقة البحثية "نماذج التفكير الهرمي" تقوم بجولات مؤخرا ، حيث جمعت عشرات الآلاف من الإعجابات على Twitter عبر العشرات من المواضيع شبه الفيروسية ، وهو أمر غير معتاد تماما بالنسبة لورقة بحثية.
تدعي الورقة دقة بنسبة 40.3٪ على ARC-AGI-1 مع نموذج صغير (27 مليون معلمة) تم تدريبه من البداية دون أي بيانات تدريب خارجية - إذا كان ذلك حقيقيا ، فهذا يمثل اختراقا رئيسيا في المنطق.
لقد قمت للتو بالغوص العميق على الورق وقاعدة التعليمات البرمجية ...
إنها قراءة جيدة ومفصلة ولكنها سهلة المتابعة. أعتقد أن الأفكار المقدمة مثيرة للاهتمام للغاية ومن المحتمل أن تكون الهندسة المعمارية ذات قيمة.
يذكرني المفهوم بالعديد من الأفكار المختلفة التي واجهتها خلال "العصر الذهبي" لأبحاث الهندسة المعمارية DL ، حوالي 2016-2018. لم يكن هذا النوع من البحث شائعا منذ فترة ، لذلك من الجيد أن نرى اهتماما متجددا بالبنى البديلة.
ومع ذلك ، يبدو أن الإعداد التجريبي معيب بشكل خطير ، مما يعني أنه ليس لدينا حاليا إشارة تجريبية (على الأقل من ARC-AGI) حول ما إذا كانت البنية مفيدة بالفعل أم لا.
تقوم تجربة ARC-AGI-1 بما يلي ، بناء على قراءتي لرمز إعداد البيانات:
1. تدرب على 876,404 مهمة ، وهي متغيرات تم إنشاؤها بواسطة الزيادة ل 960 مهمة أصلية:
... 400 من ARC-AGI-1 / قطار
... 400 من ARC-AGI-1 / eval
... 160 من ConceptARC
2. اختبر على 400 مهمة (ARC-AGI-1 / eval) ، عن طريق زيادة كل مهمة إلى ~ 1000 متغير (في الواقع ، يبلغ إجمالي المهام 368،151 فقط بسبب خصوصيات عملية التعزيز) ، وإنتاج تنبؤ لكل متغير ، وتقليل التنبؤات إلى N = 2 من خلال تصويت الأغلبية.
باختصار: إنهم يتدربون على بيانات الاختبار.
قد تسأل ، انتظر ، لماذا الدقة 40٪ إذن ، بدلا من 100٪؟ هل النموذج غير لائق بشدة؟
ذلك لأن بيانات التدريب وبيانات الاختبار تمثل نفس المهام الأصلية * في أشكال مختلفة *. يتم تطبيق زيادة البيانات بشكل مستقل على مهام التقييم في بيانات التدريب ومهام التقييم في بيانات الاختبار.
لذا فإن ما تقيسه التجربة ، تقريبا ، هو كيف يتمكن النموذج من التعميم على المتغيرات التي تم إنشاؤها إجرائية لنفس المهام (أي ما إذا كان النموذج يمكنه تعلم عكس مجموعة ثابتة من تحويلات الشبكة الثابتة).
لذا -- لا تتحمس كثيرا حتى الآن. لكنني أعتقد أن هذا النوع من أبحاث الهندسة المعمارية ذو قيمة (عندما تكون مصحوبة بإشارة تحقق تجريبية مناسبة) وأن فكرة إدارة الموارد البشرية مثيرة للاهتمام للغاية.
أيضا ، لكي أكون واضحا ، لا أعتقد أن المؤلفين كان لديهم أي نية لتضليل وإخفاء المشكلة التجريبية - ربما لم يدركوا ما يعنيه إعداد التدريب الخاص بهم في الواقع.
19.55K
قد تصدر أيضا تقرير أغسطس الآن ، tbh.

Spencer Hakimianمنذ 8 ساعاتٍ
سيكون الأمر مضحكا عندما يصدر تقرير الوظائف الشهر المقبل ويظهر أن 47,835,750 وظيفة تمت إضافتها في أغسطس ويونيو ويوليو تتم مراجعة كل منها بالزيادة بمقدار 22,520,340 وظيفة تمت إضافة كل منها.
2.08K
الطاقة الشمسية في تكساس * مهم * تنمو.
والبطاريات تجعلها أكثر ثباتا.

Samمنذ 11 ساعةً
ERCOT '25 يوليو سولار مقارنة ب 24 و 5 سنوات مضت
1. ملف الإنتاج
2. التأثير على ملف تعريف الحمل الصافي &
3. التأثير على أسعار الجملة بالساعة بالنسبة لمتوسط السعر الشهري
أسواق الطاقة بالجملة ، يريدون فقط التعلم

2.24K
هل هذا هو أكبر تأثير في العالم الحقيقي أحدثته الطباعة ثلاثية الأبعاد حتى الآن؟

Roy🇨🇦1 أغسطس، 22:13
داخل إحدى مزارع الطباعة ثلاثية الأبعاد الكبيرة لمنتج الطائرات بدون طيار الأوكراني وايلد هورنتس.
@wilendhornets
2.29K
كل من المرافق الاحتكارية والمجموعات المتعارضة (اليسار واليمين) التي تستخدم قوانين التصاريح والبيئة هي عوائق أمام وفرة الطاقة النظيفة. إنها "و" ، وليس "أو".

Jeff Hauser1 أغسطس، 02:54
لذلك يكتب أحد الشب بايدن تحليلا واضحا وموجزا للمشاكل الحالية المتعلقة بالطاقة يوضح أن المرافق ، وليس اليساريين ، هي المشكلة.
وهل يتم نشره في نيويورك تايمز أو أتلانتيك أو فوكس أو وابو؟
لا - إنه في الغوص المرافق.
2.66K
أنا لا أبيع بالكامل على ساعات الشيخوخة اللاجينية ، لكن هذا لا يزال رائعا لرؤيته. وليس من المستغرب.

Eric Topol1 أغسطس، 22:07
في تجربة عشوائية خاضعة للتحكم الوهمي ، أدى semaglutide (Ozempic) إلى إبطاء الشيخوخة اللاجينية ووتيرة الشيخوخة عبر 11 ساعة من الأعضاء والنظام
(ما قبل الطباعة)

4.71K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز