È stato un esercizio divertente recentemente aprire un file completamente vuoto e scrivere un agente RL da zero, senza guardare alcun mio codice precedente. C'è un punto di scala in cui riscrivere le cose da zero è una cattiva idea, ma è una benedizione quando puoi farlo! Con "da zero" intendo con pytorch, e sorrido un po' pensando a quanto fossi irritato quando le persone dicevano così, poiché consideravo che non fosse da zero se non era in C senza librerie, ma ora sono diventato come loro.
204,56K