我真的很喜歡這個圖表 它顯示了今天的前六名前沿 LLM 我的初步觀察: 1 • gemini 是一個很棒的 LLM 2 • k2 和 r1 的價值都非常驚人 3 • 質量競爭非常激烈,但定價卻不然 我承認我沒有像使用 sonnet 4 那樣多地使用 gemini 2.5 pro。這即將改變。 k2 和 r1 的定價令人難以置信。 k2 基於與 r1 相同的架構 - 這感覺像是 LLM 設計的未來? 最後,k2 的 ELO 與 opus 相同,但便宜 29 倍。這裡有很多改進的空間。
源:
3.58K