vui: 3/4 tháng trước, tôi đã chạy o3 cho một số học giả về một bộ vấn đề theo kiểu AIME. Họ đã mất quá nhiều thời gian để viết một bản tóm tắt về kết quả (96% nếu tôi nhớ không nhầm) đến nỗi Alex đã giải quyết chứng minh & IMO trong thời gian đó, haha.
@littmath Nói vậy, không rõ liệu bằng chứng sẽ được giải quyết trước khi họ phát hành bản nháp đó.
86,71K