Noam Brown của openAI đã xác nhận 2 điểm chính: 1) mô hình đạt được hiệu suất vàng cấp IMO là đa mục đích — không được tinh chỉnh cho toán học, và đã đạt được điều đó mà không sử dụng công cụ 2) openAI đã phát triển các kỹ thuật mới giúp LLM tốt hơn rất nhiều liệu đây có thể là một bước đột phá mới trong RL hay một cải tiến thuật toán?
27,94K