Ik hoorde dat reinforcement learning alleen werkt met verifieerbare beloningen? 😛 Gefeliciteerd!!
Alexander Wei
Alexander Wei19 jul, 15:50
1/N Ik ben enthousiast om te delen dat onze nieuwste @OpenAI experimentele redeneermodule (LLM) een langdurige grote uitdaging in AI heeft bereikt: goudmedaille-niveau prestaties op de meest prestigieuze wiskundewedstrijd ter wereld—de Internationale Wiskunde Olympiade (IMO).
31,23K