Vi presenterar 'AutoRL' 📈 Världens enklaste sätt att träna en uppgiftsspecifik LLM med RL. *Skriv bara en MENING som beskriver den modell du vill ha.* En kedja av AI-system kommer att generera data + rubriker och träna en modell åt dig. Drivs av ART, det är öppen källkod. Länk i tråden:
@theRohitDas För den här körningen spenderade jag $0 på GPU:n och 40 cent på OpenRouter-krediter för snabb generering, RULER-rankning, etc.
140,3K