Gosto que a Artificial Analysis seja transparente sobre como avaliam os modelos e tornem os dados públicos, é um verdadeiro serviço. No entanto, vejo pessoas a citar o seu Índice de Inteligência como uma métrica sem perceber que é uma média dos mesmos benchmarks correlacionados e semi-saturados que todos usam.
16,76K