Akhirnya mendapatkan yang besar. Qwen3.5-122B-A10B — 122 miliar parameter. Terlalu besar untuk GPU konsumen tunggal. Jadi saya menyewa 4 dari masing-masing ... dan kemudian satu kartu profesional untuk melihat apakah kekerasan itu penting. - 1x RTX PRO 6000 (96GB): 101.4 tok/dtk - 4x 5090 (128GB): 87.0 tok/dtk - 4x 4090 (96GB): 25,1 tok/dtk - 4x 3090 (96GB): 20,8 tok/dtk Satu kartu $8,500 mengalahkan empat RTX 5090