La forma más fácil de reducir la pérdida de predicción del próximo token: haz que lo que estás prediciendo se parezca más a ti.
2.61K