header
david rein
Sentio ergo summa. utveckla vetenskapen om AI-agentutvärderingar vid @METR_Evals, gjorde tidigare gpqa vid NYU, @cohere