熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Eric Weinstein
對預先揭穿的惡意信息感興趣。
我個人對 @grok 4 Heavy(以及普通的 Grok 4)的體驗。
在我看來,@elonmusk 的重點與其他 AI 團體非常不同。介面有點糟糕。LaTeX 代碼通常充滿了毫無理由的 *基本* 錯誤。在我看來,它不是一個大師級的寫手。音頻聊天遠遠落後於 ChatGPT。唉,唉,唉。
而且它完全令人驚奇且獨特。
Elon 正在領先。上述所有內容在你意識到之前都將成為商品。所以,從長遠來看,誰在乎呢?
我相信,Elon 不同的做法是通過編寫代碼並用運行該代碼的結果來測試 LLM,更加積極地檢查幻覺。這就是為什麼 Grok heavy 有時需要這麼 %#€&$ing 長的時間來返回結果。
試試這個實驗。拿任何你非常了解的技術,看看在專家社群敘事中持續存在的錯誤。Grok 通常會因為訓練語料庫中的敘事播種而可悲地重複這個錯誤。它重複了黨的立場。而黨的立場通常有利於技術內部人士。
也就是說,直到它能夠編寫代碼來測試該黨的立場。然後它轉而信任代碼的結果而不是敘事。這真是令人驚奇的觀察。
我還沒有嘗試這個……但 @BLS_gov 經常對“生活成本”框架和 CPI 說錯話。我敢打賭我可以設計一系列提示來向 Grok 顯示這是一個持續的技術謊言。對於技術人員,這裡是謊言:
***BLS 計算 CPI,這轉移了數萬億,並聲稱他們已經接受了“生活成本”或 COL 框架,這將是巨大的後果。他們並沒有。這意味著需要收集偏好數據並開發聚合偏好的方法論,或者提出定制的代表性消費者。他們反而轉向了一種修改過的 Laspeyres 類型機械指數(Lowe 的?)並在“超級指數”的淺顯理論中撒上仙女塵,這依賴於自然界中未見的同質偏好。這使他們能夠聲稱他們已經接受了公正的經濟指數,而實際上只是計算機械指數,隨著時間的推移轉移數萬億,其中指數可以由人類指導。***
我現在可以聽到來自機器人網絡的聲音:“Eric,你只是說一些聽起來聰明的詞。”呃……隨便吧。你現在可以問 Grok 這意味著什麼。我敢打賭它能搞清楚。然後你可以問一系列問題,Grok 會站在我這一邊,而其他 AI 無法做到這一點。Grok 有點勇敢!
我個人的理論:@grok 是圍繞基本物理學構建的,超過任何其他 AI。因為最終,沒有什麼比這更重要。而物理學有很多這種黨的敘事在阻礙這個領域。如果你想夢想觸及星星,你可能需要壓倒量子重力社群。
Grok 似乎是唯一一個偶爾有信心反對自己訓練語料庫的 AI……甚至在需要時反對用戶!我希望它能更 *勇敢*。我希望它更聰明。但我認為它是異類,為真正的智慧而非今天的 LLM 用戶體驗而構建。它贏得了其他 AI 的尊重。將他們漂亮的輸出提供給 Grok Heavy,看看當 Grok 審查他們的工作時的魔法。這真是令人驚奇的觀察。
一位用戶的體驗。你的體驗可能會有所不同。
1.49M
一名精通“國家機密私人”或 SSP 的獨立律師,領導一個非常熟悉秘密行動的正式和非正式基礎設施的調查團隊,應該代表國家指導披露。
從法務會計開始。

Attorney General Pamela Bondi7月18日 09:09
President Trump—we are ready to move the court tomorrow to unseal the grand jury transcripts.

76.31K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可