Little Octopus @OpenledgerHQ は、帰属証明メカニズムの重要な説明を更新しました。これは、いつものようにいくつかの技術的な側面をカバーしています 私はテクノロジーについて知らないので、この帰属証明メカニズムの理解と実際的な意義をわかりやすく書くことしかできません テクノロジーを理解している教師を歓迎します 🙋 従来の言語モデルでは、n-gram(固定長の単語シーケンス)を使用して次の単語を予測しますが、これは高速ですが、予測のソースやデータの貢献者を追跡するためのコンテキストが不足しています 📖Infini-gramメカニズムの説明:OpenLedgerのOpenLedgerのProof of Attribution(PoA)メカニズムは、従来のn-gramの代わりにInfini-gramを使用するため、Infini-gramはn-gramの制限を破ります これは、接尾辞配列に基づく∞-gram(無限長)アトリビューションフレームワークに基づくシンボリックスパンマッチングエンジンであり、トレーニングデータ内のすべての長さのシーケンスにインデックスを付け、モデルの出力内の各トークンのリアルタイムトレーサビリティをサポートして、そのソースを特定することができます。 Infini-gramはOpenLedgerの帰属証明システムをサポートしており、モデルの内部にアクセスすることなく、モデルの応答からトレーニングデータまでの正確な追跡を可能にし、高速、透過性、再現性を維持します 👍 このメカニズムの実際的な重要性:(個人的な解釈、問題がある場合は、修正を歓迎します) 1.正確なトレーサビリティ、透明性、信頼性:Infini-gramは、AIモデルの出力を単語ごとに追跡することをサポートし、答えがどのトレーニングデータから来ているかを教えてくれます これは、AIに「ソースタグ」を付けてプロセス全体を明確にするようなものです。 ユーザーは、AIが何を言ったのか、なぜ言ったのかを一目で知ることができ、完全な透明性と完全なトレーサビリティシステムを備えています 2. データ提供者の公正な認識:データを提供する貢献者に対しては、Infini-gramはAIが回答を生成するのにどのデータを支援するかを明確にすることができ、最終的にデータ貢献者を見て認識することができます このアプローチにより、AIエコシステムはより公平になり、より多くの人々が高品質のデータを共有するようになります 3.拡張可能+効率的:サフィックス配列に基づくInfini-gramのフレームワークは、データ量がどれほど多くてもリアルタイムでソースを追跡でき、効率がいっぱいです さらに、複雑な勾配計算を必要とせず、大規模なデータセットシナリオに簡単かつ効率的にスケーリングできます 4. AIの信頼性とコンプライアンスの向上:Infini-gramは、AIモデルに「検証可能なIDカード」を提供できるため、出力コンテンツでソースを正確に特定できます これにより、ユーザーはAIに対する信頼度を高めるだけでなく、規制要件を満たし、AIのコンプライアンスと倫理性を高めることができます 🤔 上記は私の個人的な考えと解釈です:現在、一部の人々はAIが間違いを犯し、間違った情報やデータをAIに注入するように誘導するつもりであり、Little Octopusのこの機能は、エラーデータの原因を追跡し、AIエラーを修正するのに役立つ優れた実用的なアプリケーションシナリオを備えています この機能が将来どのように機能するかを楽しみにしています
Openledger
Openledger7月10日 20:45
OpenChatはあなたによって運営されており、あなたのクレジットを与えるために構築されています。 送信したメッセージ、共有したデータセット、または微調整したモデルはすべて、オンチェーンで記録されます。 Proof of Attributionを使用すると、あなたの貢献が記憶されるだけではありません。彼らは報われます 🐙
21.94K