Ich habe gehört, dass verstärkendes Lernen nur mit verifizierbaren Belohnungen funktioniert? 😛 Herzlichen Glückwunsch!!
Alexander Wei
Alexander Wei19. Juli, 15:50
1/N Ich freue mich, mitteilen zu können, dass unser neuestes experimentelles Reasoning-LLM von @OpenAI eine langjährige große Herausforderung in der KI erreicht hat: eine Goldmedaille auf dem weltweit prestigeträchtigsten Mathematikwettbewerb – der Internationalen Mathematik-Olympiade (IMO).
31,14K