Nvidia vừa công bố Vera Rubin. Ra mắt vào nửa cuối năm 2026. Các con số thật ấn tượng: → Hiệu suất cao gấp 10 lần mỗi watt so với Blackwell → Chi phí token suy diễn rẻ hơn gấp 10 lần → Cần ít GPU hơn gấp 4 lần để đào tạo cùng một mô hình MoE Năng lượng là nút thắt lớn nhất trong AI. Nvidia vừa làm cho nó rẻ hơn gấp 10 lần.