Presentiamo `AutoRL` 📈 Il modo più semplice al mondo per addestrare un LLM specifico per un compito con RL. *Scrivi semplicemente una FRASE che descriva il modello che desideri.* Una catena di sistemi AI genererà dati + rubriche e addestrerà un modello per te. Supportato da ART, è open source. Link nel thread:
@theRohitDas Per questa esecuzione, ho speso $0 per la GPU e 40 centesimi per i crediti di OpenRouter per la generazione dei prompt, il ranking RULER, ecc.
140,29K