仕事を終えて、学部のトポロジー問題でGrok-4を試しました。考えるのに9分かかり、その後、自信を持って、きれいでもっともらしい、しかし完全に間違った答え😅を出しました これが「巧みに敵対的」であるとは思わないでください。AIモデルはベンチマークを圧倒していますが、実際の数学AGIにはまだ長い道のりがあります。
Elon Musk
Elon Musk7月10日 16:47
Grok 4は、巧みに敵対的でない限り、数学/物理の試験問題を基本的に間違えることはないという点にあります。 質問のエラーやあいまいさを特定し、質問のエラーを修正するか、あいまいな質問の各バリアントに回答できます。
663.03K