header
david rein
Sentio ergo sum. تطوير علم تقييمات الوكلاء الذكاء الاصطناعي في @METR_Evals ، صنع السابق GPQA في جامعة نيويورك ، @cohere