modele popytu zostały zbudowane dla ludzi, którzy uderzają w API kilka razy na minutę... maksymalnie ale miliony agentów nigdy nie śpią, nigdy nie grupują, nigdy nie czekają przeprowadzają wnioskowanie nieprzerwanie, w każdej strefie czasowej, z zerową tolerancją na stanie w kolejce AWS nie może budować centrów danych wystarczająco szybko, aby zaspokoić ludzkie zapotrzebowanie. nawet nie uwzględniają tego, co agenci robią z tą krzywą czas na aktualizację modeli to niedoszacowanie