Siamo stati molto impegnati ultimamente: nuove arene, nuovi modelli e nuove metodologie! Abbiamo quindi creato una pagina di changelog dove puoi tenere traccia di tutti gli aggiornamenti che apportiamo alle classifiche. Oltre alla nuova Ricerca Arena e ai nuovi modelli come l'ultimo Imagen 4, Grok 4, Kimi K2, Seedream 3 e SeedEdit 3, abbiamo anche apportato alcune modifiche metodologiche: ☑️ Mantenere alta l'integrità rafforzando il nostro processo di deduplicazione e gestione delle perdite di identità per garantire che vengano utilizzati dati freschi e imparziali per le classifiche ☑️ Ottimizzare le prestazioni passando da intervalli di confidenza bootstrap a una versione a forma chiusa ☑️ Ribilanciare i dati di voto per rappresentare in modo più equo i modelli con meno dati raccolti
20,19K