Sorprendente por lo similar que es la Ley de Goodhart -familiar para cualquiera que haya trabajado en un trabajo corporativo- para recompensar la piratería / juegos como un problema en RL. Aunque una diferencia clave quizás esté en la Ley de Goodhart, es el acto mismo de hacer que una métrica sea el objetivo lo que hace que deje de ser una buena métrica.
26.23K