AIの次のフロンティアは、コンピューティングや大規模なモデルではなく、より優れたデータです。今日は、実際にその問題を解決するために人生を費やした数少ない人物の一人を紹介します。 新しい最高AI責任者である@SPChinchaliさん、ようこそ。 AI の最前線は、より多くのパラメーターを持つモデルや、より多くの GPU を持つコンピューティング クラスターによって定義されることはなくなりました。 これは、物理世界(ロボティクス、自律型ハードウェア、エッジデバイスなど)からの高信頼性でIPクリアされたデータの不足によって定義されます。サンディープは、このフロンティアを追いかけることにキャリアを費やしてきました。今、彼は私たちがそれを解き放つのを手伝ってくれています。 初めてサンディープに会ったとき、彼の柔らかな話し方と愛情のこもった態度に心を打たれました。彼の話し方は、ニューロシンボリックAIを説明しているのか、どこへ行っても持ち歩くエイリアンのような人間工学に基づいたキーボードを称賛しているのか、どちらにしても引き込まれる。 彼の経歴はそれ自体を物語っています:スタンフォード博士、NASA JPL。現在、テキサス大学オースティン校の教授であり、分散型MLとロボティクスの交差点で研究をリードしているSandeep氏は、AIトレーニングに役立つデータを取得して現実世界で役立たせる方法に夢中になっています。 分散ネットワークに対するデータインセンティブを作成する>、 >エッジロボティクスの典型的なロングテールサンプリング問題に取り組んでいます。 >、出所を保持するシステムを設計します。 Sandeepは、私が長年取り憑かれてきたテーゼ、つまり本当の堀はデータであるという主張も確認しました。スクレイピングされたRedditフォーラムや一般的なWebテキストではなく、帰属し、権利がクリアされた、現実世界のデータです。物理システムを堅牢にするために必要な乱雑で予測不可能なデータは、シミュレーションできません。 午前 2 時の滑りやすいローディングドックロボット、風力タービンのブレードのかすかな亀裂、LiDAR ユニットがこれまでに見たことのないコーナーケースなど、物理システムが実際に目にする乱雑なロングテールデータを調達し、キュレーションしています。その瞬間は知的財産であり、貴重なものです。そのIPをリアルタイムでプログラム可能、ライセンス可能、追跡可能、収益化可能にすることができれば、地球上のすべてのAIチームのフライホイールを解き放つことができます。 プログラマブルIPは、これを可能にする唯一のバックボーンです。ほとんどのcrypto x AIの試みは、既存のインフラに「AI」をボルトで固定します。Sandeepが参加するのは、Storyがこの種のデータ調整の課題を解決するためにゼロから構築されているためです ストーリーは、ダイナミックで構成可能な関係のために構築されています。当社のプロトコルは、最新のAIシステムが要求するグラフベースの来歴、ダイナミックライセンス、および自動化されたロイヤリティフロー向けに設計されています。写真のライセンスを取得し、ラベルを追加し、合成バリエーションを生成し、Storyでは、各アクションが透明なグラフにリンクされた新しいIPアセットになり、価値がすべての寄稿者に還元されます。 Sandeepの到着はターニングポイントです。Story の第 2 章が焦点を当て、AI インフラストラクチャの次のフェーズは始まったばかりです。 彼の深い知性、純粋な好奇心、そして静かな献身の組み合わせは、まさにこの瞬間が求めているものです。彼と一緒にAIの未来を築くことに、これ以上ないほど興奮していますし、これからもたくさんのことが待ち受けています。 乞うご期待!
Sandeep Chinchali
Sandeep Chinchali7月17日 23:00
私は、AIを現実の世界で機能させるためには、どのように適切なデータを収集するかという1つの疑問を追い求めてきました。 スタンフォード大学の研究室からUTオースティンの教室まで、あらゆる場所を探しました。その答えは、別のAIラボではなく、データをIPとして扱うために構築されたブロックチェーンです。そこで、私は@StoryProtocolのチーフAIオフィサーとして入社します。 スタンフォード大学では、ロボットの群れが分散コンピューティングを使用して一緒に学習する方法である「クラウドロボティクス」を研究しました。これを解決するために、車にドライブレコーダーを取り付けました。 ロボットが見たものの5〜10%しかアップロードできなかった場合、最も価値のあるデータをどのように選択すればよいのでしょうか? そのほとんどは退屈な高速道路の映像でした。しかし、<1%は、自動運転のWaymos、建設現場、予測不可能な人間など、珍しいシーンをキャプチャしました。この「ロングテール」データにより、モデルがよりスマートになりました。手書きでラベルを付けたり、Google Cloud のラベリング サービスにお金を払って「LIDAR ユニット」や「自律走行車」などのニッチなコンセプトで映像に注釈を付けたり、USB サイズの TPU で動くモデルのトレーニングを行ったりしました。しかし、アカデミアはそこまでしか進んでいません。 UTオースティンでは、私の質問は変わりました。 → MLを改善するために、希少なデータをどのようにクラウドソーシングしますか? → 実際にどのようなインセンティブシステムが機能しますか? それが私を暗号、ブロックチェーン、トークンエコノミー、さらにはDePINに引き込みました。私はブログを書いたり、分散型MLに関する論文を書いたりしましたが、それでも疑問に思いました:このインフラストラクチャを実際に構築しているのは誰なのか? 偶然にも、ストーリーチームと出会ったのです。私は彼らのパロアルトオフィスで講演をするように招待されました。午後6時で、部屋はまだ満員でした。「Neuro-Symbolic AI」についてとりとめもなく話しましたが、最後に「A Dash of Crypto」というスライドで終わりました。その話はアドバイザーの役割に変わり、今ではもっと大きなものに変わりました。 私たちは今、極めて重要な瞬間にいます。コンピューティングはほぼ解決されています。モデルアーキテクチャは一晩でコピーされます。本当の堀はデータです。 Redditをスクレイピングしていません。終わりのない言語ではありません。しかし、権利が認められたロングテールの実世界のデータであり、ロボット、AV、乱雑な世界をナビゲートするシステムなど、具現化されたAIを訓練します。 想像してみてください:私は珍しい運転シーンをドライブレコーダーでキャプチャし、それをストーリーに登録します。友人がラベルを貼っています。AIエージェントは、合成バリアントを作成します。Storyのグラフ構造のチェーンでは、それぞれがリンクされたIPになります。ロイヤリティは自動的に返金されます。誰もが支払いを受け、すべてのステップをオンチェーンで追跡できます。 そのため、私は現在、Storyの最高AI責任者として、分散型のIPクリアトレーニングデータのレールを構築しています。今こそ、データを新しいIPにする時です。ストーリーはそれを行う場所です。 さらに多くのことが近日中に公開される予定です。行きましょう。
feedsImage
6.28K