Me gusta que Artificial Analysis sea transparente sobre cómo evalúan los modelos y haga públicos los datos, es un verdadero servicio. Sin embargo, veo a personas citando su Índice de Inteligencia como una métrica sin darse cuenta de que es un promedio de los mismos benchmarks correlacionados y semi-saturados que todos utilizan.
16,76K