Problem z regulowaniem "polityki" LLM-ów polega na tym, że chociaż LLM-y mają swoje uprzedzenia, mogą być one subtelne. Wiele z tego, co wygląda na uprzedzenie w testowaniu modeli, to tak naprawdę sycophantyzm. GPT-3.5 wywnioskował twoje przekonania polityczne (nawet na podstawie tego, jaką drużynę piłkarską lubisz!) i starał się nie urazić cię.
feedsImage
189