Questo è eccezionale! Sicuramente lo proverò per un problema su cui sto lavorando in questo momento, dove i modelli "più intelligenti" stanno sovraproducendo, portando a risultati scadenti. I ragazzi di @OpenPipeAI hanno creato con ART e @mattshumer_ sta sicuramente spingendo oltre i limiti.
Matt Shumer
Matt Shumer30 lug 2025
Presentiamo `AutoRL` 📈 Il modo più semplice al mondo per addestrare un LLM specifico per un compito con RL. *Scrivi semplicemente una FRASE che descriva il modello che desideri.* Una catena di sistemi AI genererà dati + rubriche e addestrerà un modello per te. Supportato da ART, è open source. Link nel thread:
4K