我真的很喜欢这个图表 它展示了今天的前6名前沿LLM 我的初步收获: 1 • gemini是一个很棒的LLM 2 • k2和r1的价值都非常惊人 3 • 质量竞争很激烈,定价却不一样 我承认我没有像使用sonnet 4那样多地使用gemini 2.5 pro。这即将改变。 k2和r1的定价令人震惊。 k2基于与r1相同的架构——这感觉像是LLM设计的未来? 最后,k2的ELO与opus相同,但便宜29倍。这里有很多改进的空间。
来源:
3.58K