La sottomissione dei modelli deriva da rlhf, giusto? Dove gli esseri umani sono più propensi (in generale) a valutare le risposte sottomesse più in alto? Allora potremmo aspettarci che, man mano che i modelli migliorano, imparino dagli stili di scrittura chi preferirà più sottomissione rispetto a meno e si adattino di conseguenza. Coloro che desiderano mantenere la propria sanità mentale potrebbero voler considerare di cercare di diventare il tipo "meno" il prima possibile.
2,31K