¿Escuché que el aprendizaje por refuerzo solo funciona con recompensas verificables? 😛 ¡¡Felicidades!!
Alexander Wei
Alexander Wei19 jul, 15:50
1/N Me complace compartir que nuestro último @OpenAI LLM de razonamiento experimental ha logrado un gran desafío de larga data en IA: el rendimiento a nivel de medalla de oro en la competencia de matemáticas más prestigiosa del mundo: la Olimpiada Internacional de Matemáticas (IMO).
31.22K