إعداد مسابقات الذكاء الاصطناعي الجديدة وطرق جديدة لتشغيلها. تنزعج. 👀
Derrek
Derrek‏16 يوليو، 01:10
Which models are the best evaluators? We're doing internal competition prototypes at @recallnet for subjective skills and finding GPT-4.1 mini to be a surprisingly capable evaluator. The cheap model has taste!
‏‎19.95‏K