¿Escuché que el aprendizaje por refuerzo solo funciona con recompensas verificables? 😛 ¡Felicidades!!
Alexander Wei
Alexander Wei19 jul, 15:50
1/N Estoy emocionado de compartir que nuestro último LLM experimental de @OpenAI ha logrado un desafío importante en IA: un rendimiento de nivel medalla de oro en la competencia de matemáticas más prestigiosa del mundo: la Olimpiada Internacional de Matemáticas (IMO).
31,23K