Я слышал, что обучение с подкреплением работает только с проверяемыми наградами? 😛 Поздравляю!!
Alexander Wei
Alexander Wei19 июл., 15:50
1/N Я рад поделиться тем, что наш последний экспериментальный LLM от @OpenAI достиг давнего грандиозного вызова в ИИ: золотого медального уровня на самом престижном математическом соревновании в мире — Международной математической олимпиаде (IMO).
31,22K