muito entusiasmado para ver para onde vamos a partir daqui com os modelos de sistema operacional
pash
pash19/07, 09:58
Gostaria de salientar que, para tarefas do mundo real (não benchmarks), o Kimi K2 supera o Gemini. Esta é a telemetria de todos os usuários @cline, mostrando a taxa de falhas de edição. Note como o Kimi tem cerca de 6% de taxa de falha, o que é significativamente melhor do que a taxa de erro de ~ 10% do Gemini. Notavelmente, o Kimi até superou o Claude 4 na maior parte desta semana, alcançando uma taxa de falha abaixo de 4%!.
7,39K