如果你可以向一个聊天机器人提问,问题的规模相当于整个百科全书——并实时获得答案,会怎么样呢? 借助 #NVIDIAResearch 的创新 Helix Parallelism,现在可以进行多百万个令牌的查询,用户数量增加了 32 倍,推理在大规模下变得可能。 🔗
14.11K