os modelos de demanda foram construídos para humanos a aceder a APIs algumas vezes por minuto... máximo mas milhões de agentes nunca dormem, nunca agrupam, nunca esperam eles executam inferências continuamente, em todos os fusos horários, com zero tolerância para ficar na fila A AWS não consegue construir centros de dados rápido o suficiente para a demanda humana. eles nem estão a considerar o que os agentes fazem a essa curva a hora de atualizar os modelos é um eufemismo