Einführung von `AutoRL` 📈 Der einfachste Weg der Welt, ein aufgaben-spezifisches LLM mit RL zu trainieren. *Schreiben Sie einfach einen SATZ, der das Modell beschreibt, das Sie möchten.* Eine Kette von KI-Systemen wird Daten + Rubriken generieren und ein Modell für Sie trainieren. Angetrieben von ART, ist es Open Source. Link im Thread:
@theRohitDas Für diesen Durchlauf habe ich 0 $ für die GPU ausgegeben und 40 Cent für OpenRouter-Guthaben zur Generierung von Eingabeaufforderungen, RULER-Ranking usw.
140,28K