これが実用的なイノベーションの姿です。 @sfcomputeと@modularcompany LSIを立ち上げたばかりです。 1兆トークン規模で推論が85%安価。深刻なワークロード向けに構築されており、トークンの価格設定は実際のコンピューティングコストに結びついています。 金属に対する価格。パフォーマンスを最大限に引き出す。 @caladanxyzまさにこの理由で彼らを支持しました。
evan conrad
evan conrad7月3日 01:57
私たちはModularと提携して、OpenAIと互換性のある新しい推論サービスであるLarge Scale Inference(LSI)を作成しました。 他の製品よりも最大85%安価で、1兆トークンの規模を処理できます。 もともとは、大手AIラボからの依頼で、大規模なマルチモーダル合成データ作成を数千万ドル安く行うために作成しました。 LSIは他のサービスとは異なり、市場価格を採用しています。トークンの価格は、sfcompute と現在のシステム負荷の基礎となるコンピューティング価格の関数です。言い換えれば、それは常に、永遠に最高の価格です。多くの人が推論は底辺への競争であると主張しているので、私たちはあなたに底を売ります。 LSIは、ModularのMAX & Mammoth推論フレームワークに基づいて構築されており、これはサービングスタックの高度に最適化された再設計であり、複数のチップをサポートしています。 ModularのワールドクラスのエンジニアリングとSFCの容赦ない価格最適化により、私たちは世界最高のパフォーマンスとベストプライスの推論を作成することに取り組んでいます。 見積もりを取得するには、お問い合わせください。 私たちは、お客様ごとにオーダーメイドのプロセスを実行し、お客様固有の要件に合わせて最適化し、価格とパフォーマンスがお客様の期待に合致した場合にのみ展開します。ほとんどのオープンソースモデル(DeepSeek、Llama、Qwenなど)をサポートしていますが、特注のプロセスにより、お客様の状況に応じてカスタムモデルやニッチな要件を実行できます。 DMは開いていますが、以下のリンクから連絡を取ることもできます。
131