Podoba mi się, że Artificial Analysis jest otwarte na temat tego, jak ocenia modele i udostępnia dane publicznie, to prawdziwa usługa. Jednak widzę, że ludzie cytują ich Indeks Inteligencji jako wskaźnik, nie zdając sobie sprawy, że jest to średnia tych samych skorelowanych, półnasyconych benchmarków, które wszyscy używają.
14,48K