header
david rein
مجموع المجموعة. تطوير علم تقييمات وكلاء الذكاء الاصطناعي في @METR_Evals ، تم إعداده مسبقا GPQA في جامعة نيويورك ، @cohere