Zpětnovazební učení velkých jazykových modelů, jaro 2025 (UCLA) Skvělá sada nových přednášek o zpětnovazebním učení LLM. Pokrývá širokou škálu témat souvisejících s RLxLLM, jako jsou základy/základy, výpočty v testovacím čase, RLHF a RL s ověřitelnými odměnami (RLVR).
69,52K