model permintaan dibangun untuk manusia yang memukul API beberapa kali per menit... maks Tapi jutaan agen tidak pernah tidur, tidak pernah berkelompok, tidak pernah menunggu Mereka menjalankan inferensi terus menerus, di setiap zona waktu, tanpa toleransi untuk tetap mengantre AWS tidak dapat membangun pusat data dengan cukup cepat untuk permintaan manusia. mereka bahkan tidak memperhitungkan apa yang dilakukan agen pada kurva itu Waktu untuk memperbarui model adalah pernyataan yang meremehkan