Recentemente, foi um exercício divertido simplesmente abrir um arquivo completamente em branco e escrever um agente de RL do zero, sem olhar para nenhum do meu código anterior. Há um ponto de escala onde reescrever as coisas do zero é uma má ideia, mas é uma bênção quando se pode! Por "do zero" quero dizer com pytorch, e eu dou uma risadinha sobre como costumava ficar irritado quando as pessoas diziam isso, pois considerava que não era do zero se não fosse em C sem bibliotecas, mas agora sou como elas.
204,57K