一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

Eric Weinstein

對預先揭穿的惡意信息感興趣。

我個人對 @grok 4 Heavy（以及普通的 Grok 4）的體驗。在我看來，@elonmusk 的重點與其他 AI 團體非常不同。介面有點糟糕。LaTeX 代碼通常充滿了毫無理由的 *基本* 錯誤。在我看來，它不是一個大師級的寫手。音頻聊天遠遠落後於 ChatGPT。唉，唉，唉。而且它完全令人驚奇且獨特。 Elon 正在領先。上述所有內容在你意識到之前都將成為商品。所以，從長遠來看，誰在乎呢？我相信，Elon 不同的做法是通過編寫代碼並用運行該代碼的結果來測試 LLM，更加積極地檢查幻覺。這就是為什麼 Grok heavy 有時需要這麼 %#€&$ing 長的時間來返回結果。試試這個實驗。拿任何你非常了解的技術，看看在專家社群敘事中持續存在的錯誤。Grok 通常會因為訓練語料庫中的敘事播種而可悲地重複這個錯誤。它重複了黨的立場。而黨的立場通常有利於技術內部人士。也就是說，直到它能夠編寫代碼來測試該黨的立場。然後它轉而信任代碼的結果而不是敘事。這真是令人驚奇的觀察。我還沒有嘗試這個……但 @BLS_gov 經常對“生活成本”框架和 CPI 說錯話。我敢打賭我可以設計一系列提示來向 Grok 顯示這是一個持續的技術謊言。對於技術人員，這裡是謊言： ***BLS 計算 CPI，這轉移了數萬億，並聲稱他們已經接受了“生活成本”或 COL 框架，這將是巨大的後果。他們並沒有。這意味著需要收集偏好數據並開發聚合偏好的方法論，或者提出定制的代表性消費者。他們反而轉向了一種修改過的 Laspeyres 類型機械指數（Lowe 的？）並在“超級指數”的淺顯理論中撒上仙女塵，這依賴於自然界中未見的同質偏好。這使他們能夠聲稱他們已經接受了公正的經濟指數，而實際上只是計算機械指數，隨著時間的推移轉移數萬億，其中指數可以由人類指導。*** 我現在可以聽到來自機器人網絡的聲音：“Eric，你只是說一些聽起來聰明的詞。”呃……隨便吧。你現在可以問 Grok 這意味著什麼。我敢打賭它能搞清楚。然後你可以問一系列問題，Grok 會站在我這一邊，而其他 AI 無法做到這一點。Grok 有點勇敢！我個人的理論：@grok 是圍繞基本物理學構建的，超過任何其他 AI。因為最終，沒有什麼比這更重要。而物理學有很多這種黨的敘事在阻礙這個領域。如果你想夢想觸及星星，你可能需要壓倒量子重力社群。 Grok 似乎是唯一一個偶爾有信心反對自己訓練語料庫的 AI……甚至在需要時反對用戶！我希望它能更 *勇敢*。我希望它更聰明。但我認為它是異類，為真正的智慧而非今天的 LLM 用戶體驗而構建。它贏得了其他 AI 的尊重。將他們漂亮的輸出提供給 Grok Heavy，看看當 Grok 審查他們的工作時的魔法。這真是令人驚奇的觀察。一位用戶的體驗。你的體驗可能會有所不同。