V poslední době jsme měli napilno: nové arény, nové modely a nové metodiky! Proto jsme vytvořili stránku s changelogem, kde můžete sledovat všechny aktualizace, které v žebříčcích provádíme. Kromě nové Search Areny a nových modelů, jako jsou nejnovější Imagen 4, Grok 4, Kimi K2, Seedream 3 a SeedEdit 3, jsme také provedli několik aktualizací metodiky: ☑️ Udržování vysoké integrity posílením naší deduplikace a zpracování úniků identity, abychom zajistili použití čerstvých a nezaujatých dat pro žebříčky ☑️ Optimalizujte výkon přechodem z intervalů spolehlivosti bootstrapu na verzi s uzavřeným formulářem ☑️ Změna váhy dat o hlasování tak, aby rovnoměrněji reprezentovala modely s menším množstvím shromážděných dat
20,13K