我曾在某处看到一句我非常喜欢的名言:"大型语言模型是已经解决问题的惊人解决者"。我认为这句话非常到位,揭示了它们为什么并不是真正的"智能"。
Ravid Shwartz Ziv
Ravid Shwartz Ziv7月19日 09:17
所以,所有模型在新的国际数学奥林匹克问题上都表现不如人类,而Grok-4的表现尤其糟糕,即使是使用最佳选择的情况下?真是难以置信!
13.78K