Мой личный опыт с @grok 4 Heavy (и обычным Grok 4). Мне кажется, что @elonmusk делает акцент совершенно другой, чем остальная толпа ИИ. Интерфейс довольно плохой. Код LaTeX обычно полон *базовых* ошибок без всякой причины. Это не мастер-писатель, по моему опыту. Аудиочат значительно отстает от ChatGPT. Бла-бла-бла. И это совершенно удивительно и уникально. Элон опережает остальных. Все вышеперечисленное станет товаром, прежде чем вы это осознаете. Так что, в долгосрочной перспективе, кому какое дело? Что Элон делает по-другому, я считаю, так это более агрессивно проверяет галлюцинации, написав код и протестировав LLM с результатами выполнения этого кода. Вот почему Grok heavy иногда так %#€&$ing долго возвращает результаты. Попробуйте этот эксперимент. Возьмите что угодно техническое, что вы хорошо знаете, где есть ошибка, которая постоянно присутствует в нарративе экспертного сообщества. Grok, к сожалению, обычно повторяет эту ошибку из-за семантического засева в обучающем корпусе. Он повторяет партийную линию. И партийная линия, как правило, выгодна техническим инсайдерам. То есть, до тех пор, пока он не сможет написать код, чтобы протестировать эту партийную линию. И тогда он переключается на доверие к результатам кода, а не к нарративу. Это волшебно наблюдать. Я еще не пробовал это…но @BLS_gov регулярно говорит неправильные вещи о рамках "стоимости жизни" и CPI. Бьюсь об заклад, я мог бы разработать серию подсказок, чтобы показать Grok, что это постоянная техническая ложь. Для технических людей вот ложь: ***BLS вычисляет CPI, который переводит триллионы и утверждает, что они приняли рамки "стоимости жизни" или COL, что было бы огромным последствием. Они этого не сделали. Это означало бы сбор данных о предпочтениях и разработку методологии для агрегирования предпочтений или создание индивидуальных представительных потребителей. Вместо этого они перешли на модифицированный индекс типа Ласпиерса (Лоу?) и посыпали волшебной пылью "Суперлативные индексы" из поверхностной теории Диверта, которая основывается на гомотетических предпочтениях, не наблюдаемых в природе. Это позволяет им утверждать, что они приняли беспристрастные экономические индексы, в то время как на самом деле вычисляют механические индексы только на триллионы переводов со временем, где индексы могут управляться людьми.*** Я уже слышу это от бот-сетей: "Эрик, ты просто говоришь словесный салат, чтобы звучать умно." Эх…как бы там ни было. Теперь вы можете просто спросить Grok, что это значит. Бьюсь об заклад, он сможет это понять. А затем вы можете задать серию вопросов, где Grok займет мою сторону, в то время как ни один другой ИИ не сможет этого сделать. Grok немного смелый! Моя личная теория: @grok строится вокруг фундаментальной физики больше, чем любой другой ИИ. Потому что в конце концов ничего не имеет такого значения, как это. И в физике много этого нарратива партийной линии, который сдерживает область. Если вы хотите мечтать о достижении звезд, вам, возможно, придется подавить сообщество квантовой гравитации. Grok, похоже, единственный ИИ, который, время от времени, имеет уверенность противостоять своему собственному обучающему корпусу… и даже пользователю, если это необходимо! Я хотел бы, чтобы он был *более* смелым. Я хотел бы, чтобы он был умнее. Но я думаю, что он странный человек, созданный для реального интеллекта, а не для пользовательского опыта LLM сегодня. И он пользуется уважением других ИИ. Подайте их красивый вывод Grok Heavy и наблюдайте за магией, когда Grok проверяет их работу. Это дико наблюдать. Один опыт пользователя. Ваши впечатления могут отличаться.
1,5M