Jag gillar att Artificial Analysis är öppna med hur de utvärderar modeller och gör data offentliga, det är en riktig tjänst. Men jag ser folk som citerar sitt intelligensindex som ett mått utan att inse att det är ett genomsnitt av samma korrelerade, halvmättade riktmärken som alla använder
16,76K