トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
NVIDIA ロボット工学ディレクター兼著名な科学者。GEARラボ共同リーダー。物理AGIを一度に1つのモーターで解きます。スタンフォード大学博士 OpenAIの1人目のインターン。
私はロボット工学における小さなモラベックのパラドックスを観察しています:人間にとって難しい体操は、調理、掃除、組み立てなどの「セクシーでない」作業よりもロボットにとってはるかに簡単です。それは、分野外の人々にとって「では、ロボットはパルクールやブレイクダンスはできるのに、なぜ私の犬の世話をできないのか?」という認知的不協和につながります。信じてください、私はあなたが思っている以上に両親からこのことについて尋ねられました...
「ロボット・モラベックのパラドックス」は、物理的な AI の能力が実際よりもはるかに高度であるかのような錯覚も生み出します。Unitreeは業界の最近のすべてのアクロバティックなデモに広く当てはまるので、私はUnitreeを選び出しているわけではありません。簡単なテストは、横ひっくり返りロボットの前に壁を設置すると、フルパワーで壁にぶつかり、スペクタクルを作ります。なぜなら、周囲を意識せずに、その単一の参照モーションを過剰適合しているだけだからです。
パラドックスが存在する理由は次のとおりです: 「盲目の体操選手」を訓練する方が、見て操作するロボットよりもはるかに簡単です。前者はシミュレーションで完全に解決し、ゼロショットを現実世界に転送できますが、後者は極めてリアルなレンダリング、接触物理学、乱雑な現実世界のオブジェクトダイナミクスを要求しますが、どれもうまくシミュレートすることはできません。
インターネットからではなく、純粋に手作りのテキスト コンソール ゲームから LLM をトレーニングできると想像してみてください。ロボット工学者は幸運でした。私たちはたまたま、加速物理エンジンが非常に優れているため、文字通りゼロの実際のデータを使用して印象的なアクロバットをこなすことができる世界に住んでいます。しかし、一般的な器用さのための同じチートコードはまだ発見されていません。
それまで、私たちは混乱した両親から質問を受けることになります。
351.62K
私の AGI のバーははるかにシンプルで、AI が誰の家でもどんな料理でもおいしい夕食を作るというものです。物理チューリングテストはノーベル賞よりも難しい可能性が非常に高いです。モラベックのパラドックスは、今後10年間、私たちを悩ませ続け、より大きく、より暗く迫るでしょう。

Thomas Wolf7月19日 16:06
AGI に対する私の基準は、AI が生み出した新しい理論でノーベル賞を受賞することです。
99.07K
最近、Xでは少し静かにしています。この1年は、変革的な経験でした。Grok-4とKimi K2は素晴らしいですが、ロボット工学の世界は素晴らしい西部開拓時代です。GPT-1が発表された2018年のNLPと、BERTをはじめとする数千の花々が咲いたような感じです。いずれどちらがChatGPTになるのか、誰も知りませんでした。議論は白熱しました。エントロピーは空高くなりました。アイデアはめちゃくちゃ面白かったです。
ロボティクスのGPT-1はすでにArxivのどこかにあると思いますが、どれがどれなのかは正確にはわかりません。ワールドモデル、RL、人間のビデオからの学習、sim2real、real2simなど、またはそれらの任意の組み合わせである可能性があります。議論は白熱しています。エントロピーは非常に高いです。アイデアはめちゃくちゃ楽しい、AIMEとGPQAで最後の数パーセントを絞る代わりに。
また、ロボティクスの性質上、設計空間は大きく複雑になります。LLM(テキスト文字列)のビットのクリーンな世界とは異なり、私たちロボット工学者は、原子の乱雑な世界に対処しなければなりません。結局のところ、ループにはソフトウェア定義の金属の塊があります。LLMの常識者は信じがたいかもしれませんが、今のところ、ロボット工学者はまだベンチマークに同意できません。ロボットが異なれば、能力のエンベロープも異なり、アクロバットが得意なロボットもあれば、オブジェクト操作が得意なロボットもいます。産業用のものもあれば、家事用のものもあります。クロス具現化は、単なる研究の目新しさではなく、ユニバーサルロボットの頭脳に不可欠な機能です。
私は、新旧のさまざまなロボット企業の数十人の経営幹部と話をしてきました。全身を売るものもあります。器用な手などの体のパーツを販売しているものもあります。他にも多くの企業がシャベルを販売して、新しい遺体を製造したり、シミュレーションを作成したり、大量のデータを収集したりしています。ビジネスアイデアの空間は、研究そのものと同じくらいワイルドです。これは、2022年のChatGPTの波以来見られなかったような新たなゴールドラッシュです。
エントリーするのに最適なタイミングは、コンセンサスが得られないピークに達するときです。私たちはまだ損失曲線の始まりにいます - 生命の強い兆候はありますが、収束からはほど遠いです。一歩一歩進むごとに、私たちは未知の世界へと誘われます。しかし、ひとつだけ確かなことは、乱雑な世界に触れ、感じ、体現されることなしにAGIは存在しないということです。
より個人的な話になりますが、研究所の運営には、まったく新しいレベルの責任が伴います。400万ドルの会社のCEOに直接最新情報を提供することは、控えめに言っても、スリリングであると同時に、私の注意力の重みをすべて消費することです。私がすべてのAIニュースを常に把握し、深く掘り下げることができた時代は終わりました。
私の旅をもっと共有するために時間を作ってみようと思います。

876.97K
フィジカルチューリングテスト:日曜日のハッカソンの後、あなたの家は完全に混乱しています。月曜日の夜、家に帰ると、真っ白なリビングルームとキャンドルライトディナーがあります。そして、そこに人間がいたのか、機械がいたのかはわかりませんでした。見かけによらず単純で、めちゃくちゃ難しい。
AIの次の北極星です。研究室で午前12時に私を目覚めさせる夢。ビットのチャンクではなく、原子のチャンクを自動化する次のコンピューティングプラットフォームのビジョン。
AI Ascentで私をホストしてくれたSequoiaに感謝します!以下は、汎用ロボティクスを解決するための最初の原則、つまりデータ戦略とスケーリングの法則についてどのように考えるかについての私の完全な話です。後悔しない17分になることを保証します!
107.22K
次の10年のうちのいつの日か、私たちはすべての家庭、すべての病院、工場にロボットが存在し、超人的な器用さで退屈で危険な仕事をするようになるでしょう。その日は「木曜日」と呼ばれます。チューリングでさえも、彼の最も荒唐無稽な夢の中で私たちの生涯を夢見ようとはしなかった。

signüll2025年4月21日
チューリングテストを越えたけど、誰も気にしなかった。パレードはありません。トップページの見出しはありません。正しい。。。何気なく肩をすくめる。「そうそう、機械は今や私たちをだますのに十分賢いです。とにかく、昼食は何にしようか?」
その静寂は、私たちが進んでいるペースについてすべてを物語っています。
私が CS の授業を受けていた頃は、チューリング テストはラス ボスのように扱われていました。今、すべてのブレークスルーは別の神、くそったれ火曜日です。
101.97K
2030年のヒューマノイドオリンピックは、なかなかのスペクタクルになるでしょう

Jim Fan2025年2月5日
ヒューマノイドロボットをクリスティアーノ・ロナウド、レブロン・ジェームズ、コービー・バイラントにRLしました!これらは、GEARラボの実際のハードウェア上で動作するニューラルネットワークです。あなたがオンラインで見るほとんどのロボットのデモは、ビデオをスピードアップします。私たちは実際にそれらを*遅くする*ので、あなたは流動的な動きを楽しむことができます。
この度、ヒューマノイドの全身制御のための極めて滑らかでダイナミックな動きをマスターした「real2sim2real」モデル「ASAP」を発表できることを嬉しく思います。
まず、シミュレーションでロボットを事前学習させますが、悪名高い「sim2real」のギャップがあります。つまり、手作業で操作した物理方程式が現実世界のダイナミクスと一致することは非常に困難です。
私たちの解決策は簡単で、実際のハードウェアに事前学習済みのポリシーをデプロイし、データを収集し、シミュレーションでモーションを再生するだけです。リプレイには明らかに多くのエラーがありますが、それは物理学の不一致を補うための豊富な信号を提供します。別のニューラル ネットワークを使用して、デルタを学習します。基本的には、従来の物理エンジンを「パッチアップ」して、ロボットがGPUでほぼ現実世界を大規模に体験できるようにします。
未来はハイブリッドシミュレーションです:何十年にもわたって改良された古典的なシミュレーションエンジンのパワーと、乱雑な世界をキャプチャする現代のNNの驚異的な能力を組み合わせています。
45.85K
ヒューマノイドロボットをクリスティアーノ・ロナウド、レブロン・ジェームズ、コービー・バイラントにRLしました!これらは、GEARラボの実際のハードウェア上で動作するニューラルネットワークです。あなたがオンラインで見るほとんどのロボットのデモは、ビデオをスピードアップします。私たちは実際にそれらを*遅くする*ので、あなたは流動的な動きを楽しむことができます。
この度、ヒューマノイドの全身制御のための極めて滑らかでダイナミックな動きをマスターした「real2sim2real」モデル「ASAP」を発表できることを嬉しく思います。
まず、シミュレーションでロボットを事前学習させますが、悪名高い「sim2real」のギャップがあります。つまり、手作業で操作した物理方程式が現実世界のダイナミクスと一致することは非常に困難です。
私たちの解決策は簡単で、実際のハードウェアに事前学習済みのポリシーをデプロイし、データを収集し、シミュレーションでモーションを再生するだけです。リプレイには明らかに多くのエラーがありますが、それは物理学の不一致を補うための豊富な信号を提供します。別のニューラル ネットワークを使用して、デルタを学習します。基本的には、従来の物理エンジンを「パッチアップ」して、ロボットがGPUでほぼ現実世界を大規模に体験できるようにします。
未来はハイブリッドシミュレーションです:何十年にもわたって改良された古典的なシミュレーションエンジンのパワーと、乱雑な世界をキャプチャする現代のNNの驚異的な能力を組み合わせています。
543.16K
RLフライホイールの秘密と*マルチモーダル*o1スタイルの推論が大量に書かれた*2番目の*論文が落とされたことは、今日の私のビンゴカードにはありません。Kimi氏(別のスタートアップ)とDeepSeekの論文は、同様の結果に驚くほど収束している。
> MCTSのような複雑なツリー検索は必要ありません。思考トレースを線形化し、古き良き自己回帰予測を行うだけです。
> モデルの別の高価なコピーを必要とする値関数は必要ありません。
> 緻密な報酬モデリングは必要ありません。可能な限りグラウンドトゥルース、最終結果に頼ってください。
違い:
DeepSeek>、AlphaZeroアプローチは、人間の入力なしでRLを介して純粋にブートストラップ、つまり「コールドスタート」を行います。キミはAlphaGo-Masterのアプローチを実践しています:プロンプトエンジニアリングされたCoTトレースを通じてウォームアップするための軽いSFTです。
> DeepSeekのウェイトはMITライセンスです(ソートリーダーシップ!キミはまだモデルリリースを持っていません。
> Kimiは、幾何学やIQテストなどの視覚的な理解が必要なMathVistaのようなベンチマークで、強力なマルチモーダルパフォーマンスを示しています。
> Kimiの論文には、システム設計に関する多くの詳細があります:RLインフラストラクチャ、ハイブリッドクラスタ、コードサンドボックス、並列処理戦略。学習の詳細:ロングコンテクスト、CoT圧縮、カリキュラム、サンプリング戦略、テストケース生成など
休日に明るい読書を!

300.46K
トップ
ランキング
お気に入り
Trending onchain
Trending on X
Recent top fundings
Most notable