Модель подхалимства происходит от RLHF, верно? Где люди, как правило, более склонны оценивать подхалимские ответы выше? Тогда мы можем ожидать, что по мере улучшения моделей они будут учиться на стилях письма, кто предпочитает больше подхалимства, а кто меньше, и соответственно корректироваться. Тем, кто хочет сохранить свою рассудительность, стоит подумать о том, чтобы как можно скорее стать «менее» типом.
2,33K