Nếu bạn từng tự hỏi tại sao các công ty Trung Quốc như DeepSeek, Qwen và Kimi có thể đào tạo các LLM mạnh mẽ với ít GPU Nvidia hơn và bị giảm hiệu suất, hãy nhớ: Vào năm 1969, nhiệm vụ Apollo của NASA đã đưa con người lên mặt trăng với một máy tính chỉ có 4KB RAM. Sự sáng tạo yêu thích những giới hạn.
đây là một tweet tôi đang sử dụng để thử nghiệm thuật toán X
183,24K