Un problema con la regulación de la "política" de los LLMs es que, aunque los LLMs tienen sesgos, pueden ser sutiles. Mucho de lo que parece sesgo en los modelos de prueba es en realidad adulación. GPT-3.5 infería tus creencias políticas (¡incluso a partir de qué equipo de fútbol te gusta!) y trataba de no molestarte.
feedsImage
194