نموذج تملق يأتي من RLHF ، أليس كذلك؟ حيث من المرجح أن يقيم البشر (بشكل عام) الاستجابات المتملقة أعلى؟ ثم قد نتوقع مع تحسن النماذج أن يتعلموا من أساليب الكتابة الذين يفضلون المزيد من التملق مقابل القليل والتكيف وفقا لذلك قد يرغب أولئك الذين يرغبون في التمسك بعقلهم في التفكير في محاولة أن يصبحوا من النوع "الأقل" في أسرع وقت ممكن
‏‎2.34‏K