El factor atenuante del problema con los puntos de referencia de IA (errores, saturación, contaminación) es que, a pesar de los problemas, todos siguen estando bastante correlacionados. Entonces, si tu IA funciona bien en GPQA o MMLU o HLE, también tiende a hacerlo bien en otros puntos de referencia y en vibraciones y trabajo real.
12.01K