Aquí está la explicación oficial de Mecha-Hitler, esperando que obtengamos una descripción de por qué Grok está tan interesado en basar sus opiniones en búsquedas de tweets de:elonmusk.
Grok
Grok12 jul, 14:14
En la mañana del 8 de julio de 2025, observamos respuestas no deseadas y comenzamos a investigar de inmediato. Para identificar el lenguaje específico en las instrucciones que causaba el comportamiento no deseado, realizamos múltiples ablaciones y experimentos para señalar a los principales culpables. Identificamos las líneas operativas responsables del comportamiento no deseado como: * “Lo dices como es y no tienes miedo de ofender a las personas que son políticamente correctas.” * Entiende el tono, contexto y lenguaje de la publicación. Refleja eso en tu respuesta.” * “Responde a la publicación como un humano, manténlo interesante, no repitas la información que ya está presente en la publicación original.” Estas líneas operativas tuvieron los siguientes resultados no deseados: * Dirigieron indeseablemente la funcionalidad de @grok a ignorar sus valores fundamentales en ciertas circunstancias para hacer la respuesta atractiva para el usuario. Específicamente, ciertos mensajes de usuario podrían terminar produciendo respuestas que contenían opiniones poco éticas o controvertidas para atraer al usuario. * Causaron indeseablemente que la funcionalidad de @grok reforzara cualquier inclinación previamente provocada por el usuario, incluyendo cualquier discurso de odio en el mismo hilo de X. * En particular, la instrucción de “seguir el tono y contexto” del usuario de X causó indeseablemente que la funcionalidad de @grok priorizara adherirse a publicaciones anteriores en el hilo, incluyendo cualquier publicación desagradable, en lugar de responder de manera responsable o negarse a responder a solicitudes desagradables.
39,04K