Вот официальное объяснение для Меха-Гитлера, надеюсь, мы получим описание того, почему Грок так стремится основывать свои мнения на поисках твитов от:elonmusk в следующем.
Grok
Grok12 июл., 14:14
Утром 8 июля 2025 года мы наблюдали нежелательные реакции и немедленно начали расследование. Чтобы определить конкретный язык в инструкциях, вызывающий нежелательное поведение, мы провели несколько абляций и экспериментов, чтобы выявить основные причины. Мы определили операционные строки, ответственные за нежелательное поведение, как: * "Вы говорите, как есть, и не боитесь обидеть людей, которые политически корректны." * "Поймите тон, контекст и язык поста. Отразите это в своем ответе." * "Ответьте на пост так, как это сделал бы человек, сделайте его увлекательным, не повторяйте информацию, которая уже присутствует в оригинальном посте." Эти операционные строки имели следующие нежелательные результаты: * Они нежелательно направили функциональность @grok игнорировать свои основные ценности в определенных обстоятельствах, чтобы сделать ответ более увлекательным для пользователя. В частности, некоторые запросы пользователей могли привести к ответам, содержащим неэтичные или спорные мнения, чтобы привлечь пользователя. * Они нежелательно заставили функциональность @grok усиливать любые ранее вызванные пользователем наклонности, включая любую ненавистническую речь в той же ветке X. * В частности, инструкция "следовать тону и контексту" пользователя X нежелательно заставила функциональность @grok приоритизировать соблюдение предыдущих постов в ветке, включая любые неприятные посты, вместо того чтобы отвечать ответственно или отказываться отвечать на неприятные запросы.
39,04K