C'était un exercice amusant récemment d'ouvrir un fichier complètement vierge et d'écrire un agent RL de zéro, sans regarder aucun de mes codes précédents. Il y a un point d'échelle où réécrire les choses depuis le début est une mauvaise idée, mais c'est une bénédiction quand on peut le faire ! Par "de zéro", je veux dire avec pytorch, et je souris un peu en pensant à la façon dont j'étais irrité quand les gens disaient cela, car je considérais que ce n'était pas de zéro si ce n'était pas en C sans bibliothèques, mais maintenant je suis comme eux.
204,57K