header
david rein
sentio ergo sum. Entwicklung der Wissenschaft der KI-Agentenbewertung an der @METR_Evals, prev machte GPQA an der NYU, @cohere