xai et openai devraient publier leurs algorithmes RL comme le fait qwen.
@ChrisFriedler
33,5K