Проблема з регулюванням «політики» LLM полягає в тому, що, хоча LLM мають упередження, вони можуть бути непомітними. Багато з того, що виглядає як упередженість у тестуванні моделей, насправді є підлабузництвом. GPT-3.5 виводив ваші політичні переконання (навіть від того, яка футбольна команда вам подобається!) і намагався вас не засмучувати.
feedsImage
185