Förstärkningsinlärning av stora språkmodeller, våren 2025 (UCLA) Stor uppsättning nya föreläsningar om förstärkningsinlärning av LLM. Täcker ett brett spektrum av ämnen relaterade till RLxLLM:er såsom grunder/grunder, testtidsberäkning, RLHF och RL med verifierbara belöningar (RLVR).
69,53K