header
david rein
sentio ergo sum. el desarrollo de la ciencia de las evaluaciones de agentes de IA en @METR_Evals, prev hizo gpqa en NYU, @cohere