1/N Tôi rất vui mừng khi chia sẻ rằng mô hình LLM lý luận thử nghiệm mới nhất của @OpenAI đã đạt được một thách thức lớn trong AI: hiệu suất đạt huy chương vàng tại cuộc thi toán học danh giá nhất thế giới - Olympic Toán học Quốc tế (IMO).
4/N Thứ hai, các bài nộp IMO rất khó xác minh, là những bằng chứng nhiều trang. Tiến bộ ở đây đòi hỏi phải vượt ra ngoài mô hình RL với những phần thưởng rõ ràng, có thể xác minh. Bằng cách làm như vậy, chúng tôi đã có được một mô hình có thể tạo ra những lập luận phức tạp, chặt chẽ ở cấp độ của các nhà toán học con người.
5/N Ngoài kết quả chính, tôi rất hào hứng về cách tiếp cận của chúng tôi: Chúng tôi đạt được cấp độ khả năng này không phải thông qua phương pháp hẹp, cụ thể cho nhiệm vụ, mà bằng cách mở ra những con đường mới trong học tăng cường đa mục đích và mở rộng tính toán trong thời gian kiểm tra.
8/N Nhân tiện, chúng tôi sắp phát hành GPT-5, và chúng tôi rất hào hứng cho bạn thử nghiệm. Nhưng để rõ ràng: mô hình LLM vàng IMO là một mô hình nghiên cứu thử nghiệm. Chúng tôi không có kế hoạch phát hành bất kỳ thứ gì với khả năng toán học ở mức này trong vài tháng tới.
9/N Vẫn—điều này nhấn mạnh tốc độ phát triển nhanh chóng của AI trong những năm gần đây. Vào năm 2021, người hướng dẫn tiến sĩ của tôi @JacobSteinhardt đã yêu cầu tôi dự đoán sự tiến bộ của AI trong toán học vào tháng 7 năm 2025. Tôi đã dự đoán 30% trên tiêu chuẩn MATH (và nghĩ rằng mọi người khác đều quá lạc quan). Thay vào đó, chúng ta có huy chương vàng IMO.
Cuối cùng, chúng tôi xin chúc mừng tất cả các thí sinh của IMO 2025 về thành tích của họ! Chúng tôi tự hào có nhiều cựu thí sinh IMO tại @OpenAI và nhận ra rằng đây là một trong những bộ óc trẻ sáng giá nhất của tương lai.
131,52K