Мне нравится, что Artificial Analysis открыто рассказывает о том, как они оценивают модели и публикует данные, это действительно полезная услуга. Однако я вижу, что люди ссылаются на их Intelligence Index как на метрику, не осознавая, что это среднее значение тех же коррелированных, полусатурированных эталонов, которые используют все.
17,4K