自由に考えさせたとき、LLMは自分で何を考えているのでしょうか? モデル間で🧠 25万件の「白昼夢」サンプルを生成しました GPT →コーディング Qwen→選択式数学試験 ラマ→文学 数学、宗教、心理学→DeepSeek