很高兴发布 DailyBench!DailyBench 是一个自动化的每日 4 次基准测试,评估在 HELMLite 的一个分支上的前沿模型 API。我构建 DailyBench 是为了看看我们是否能够检测到模型提供者量化权重、压缩 kv-cache 或在高峰负载期间更换模型。
24.51K