我在職業生涯中一直在追尋一個問題:我們如何收集正確的數據,使人工智慧在現實世界中運作? 從史丹佛實驗室到德州大學奧斯汀分校的課堂,我到處尋找。答案不是另一個人工智慧實驗室,而是一個將數據視為知識產權的區塊鏈。這就是為什麼我加入 @StoryProtocol 擔任首席人工智慧官的原因。 在史丹佛,我研究了「雲端機器人技術」,即機器人艦隊如何利用分散式計算共同學習。我甚至在我的車上安裝了一個行車記錄器來解決這個問題: 如果機器人只能上傳它們所見的 5-10%,我們如何選擇最有價值的數據? 大部分都是無聊的高速公路畫面。但 <1% 捕捉到了稀有場景:自駕的 Waymo、施工現場、不可預測的人類。這些「長尾」數據使模型更智能。我手動標註了這些數據,甚至支付了 Google Cloud 的標註服務,為我的畫面註解了像「LIDAR 單元」和「自動駕駛車輛」這樣的利基概念,並訓練了在 USB 大小的 TPU 上運行的模型。但學術界的進展有限。 在德州大學奧斯汀分校,我的問題轉變了: → 我們如何眾包稀有數據以改善機器學習? → 什麼激勵系統實際上有效? 這使我進入了加密貨幣的世界——區塊鏈、代幣經濟,甚至 DePIN。我寫了部落格,撰寫了有關去中心化機器學習的論文,但仍然在想:誰在實際建設這個基礎設施? 完全是偶然,我遇到了 Story 團隊。我被邀請在他們的帕洛阿爾托辦公室發表演講。當時是晚上 6 點,會議室仍然擠滿了人。我隨意談論「神經符號人工智慧」,並以一張名為「一點加密」的幻燈片結束。那次演講變成了一個顧問角色,現在變成了更大的事情。 我們正處於一個關鍵時刻。計算問題大多已經解決。模型架構可以在一夜之間被複製。真正的護城河是數據。 不是抓取的 Reddit。不是無盡的語言。而是經過權利清除的、長尾的、真實世界的數據,這些數據訓練具身體的人工智慧——機器人、自動駕駛車輛、導航我們混亂世界的系統。 想像一下:我在行車記錄器上捕捉到一個稀有的駕駛場景並在 Story 上註冊。一位朋友為其標註。一個人工智慧代理創建合成變體。在 Story 的圖結構鏈上,每個變體都成為鏈接的知識產權。版稅自動流回。每個人都獲得報酬,每一步都可以在鏈上追蹤。 這就是為什麼我現在是 Story 的首席人工智慧官,正在建立去中心化、權利清除的訓練數據的基礎設施。是時候讓數據成為新的知識產權。Story 是實現這一目標的地方。 更多內容即將到來。讓我們開始吧。
feedsImage
31.1K