متحمس لمشاركة عملنا الجديد: "تتحسن نماذج اللغة عندما تتطابق بيانات التدريب المسبق مع المهام المستهدفة" نعم ، يبدو الأمر واضحا (وهو كذلك!) ، ولكن عادة ما يحدث هذا بشكل ضمني وغير مباشر: حدد البيانات بشكل حدسي → المعيار → صقلها → تكرارها. تساءلنا: ماذا يحدث إذا قمنا بمطابقة بيانات التدريب المسبق بشكل صريح مع المعايير؟ والنتيجة هي نهج بسيط ميت ينتج عنه مضاعفات حساب 2x + على خطوط أساس قوية ويعطينا طريقة مبدئية لدراسة كيفية تشكيل الخيارات المعيارية (وتقييدها!) قدرات النموذج. المكافأة: قوانين القياس الشاملة من تدريب 500+ نموذج تكشف كيف يتطور الاختيار الأمثل للبيانات مع توسع النماذج. 🧵 (1/14)
‏‎52.01‏K