grok 4 仍然无法解决我常用的困难博弈论问题 它思考了将近 10 分钟,摘要显示它在正确答案周围徘徊,但无法做出承诺 o3-pro 非常接近,数学是正确的,但陷入了幻觉陷阱——“斯塔克尔伯格相关均衡”并不存在 这个问题对 LLM 来说很难,因为相关均衡的概念在许多情况下与交换遗憾密切相关,但在这里它是一个误导性信息 答案就是“斯塔克尔伯格值”
20.26K