¡Emocionado de lanzar DailyBench! DailyBench es un benchmark automatizado de 4 veces al día que evalúa las APIs de modelos de frontera en un fork de HELMLite. Creé DailyBench para ver si podíamos detectar a los proveedores de modelos cuantizando pesos, comprimiendo el kv-cache o intercambiando modelos durante cargas máximas.
21,23K