我們最近一直很忙:新的競技場、新的模型和新的方法論!因此,我們創建了一個變更日誌頁面,您可以在那裡跟踪我們對排行榜所做的所有更新。 除了新的搜索競技場和最新的模型,如Imagen 4、Grok 4、Kimi K2、Seedream 3和SeedEdit 3,我們還進行了一些方法論的更新: ☑️ 通過加強去重和身份洩漏處理來保持高完整性,以確保排行榜使用的新鮮和無偏見的數據 ☑️ 通過從自助信心區間轉移到封閉形式版本來優化性能 ☑️ 重新加權投票數據,以更平等地代表收集數據較少的模型
20.2K