Jag har hört att förstärkningsinlärning bara fungerar med verifierbara belöningar? 😛 Grattis!!
Alexander Wei
Alexander Wei19 juli 15:50
1/N Jag är glad att kunna dela med mig av att vår senaste @OpenAI experimentellt resonemang LLM har uppnått en långvarig stor utmaning inom AI: prestanda på guldmedaljnivå på världens mest prestigefyllda matematiktävling - International Math Olympiad (IMO).
31,24K