Хаб RL-окружений и инфраструктура, которые мы запустили, сделают этот вид пост-тренировок более доступным для каждого разработчика ИИ.