我们最近一直很忙:新的竞技场、新的模型和新的方法论!因此,我们创建了一个更新日志页面,您可以在其中跟踪我们对排行榜所做的所有更新。 除了新的搜索竞技场和最新的模型,如Imagen 4、Grok 4、Kimi K2、Seedream 3和SeedEdit 3,我们还进行了方法论的更新: ☑️ 通过加强去重和身份泄露处理来保持高完整性,以确保排行榜使用的新鲜和无偏数据 ☑️ 通过从自助信心区间转向封闭形式版本来优化性能 ☑️ 重新加权投票数据,以更平等地代表收集数据较少的模型
20.14K