跳轉至主要內容
行情
熱門代幣
探索熱門代幣排名,掌握最新市場動態
掃鏈
跟蹤由 Pump.Fun 等平臺推出的最新熱門 Meme 幣
牛人榜
排行、跟蹤並分析熱門交易地址
信號
獲取實時信號,解鎖市場洞察
追蹤
追蹤你最喜歡的代幣和錢包地址
DEX
幣幣兌換
交易聚合器,多路徑選擇,自由換幣
專業交易
深度數據分析,進階交易設置,為鏈上玩家打造
DeFi
市場
發現
洞察中心
Web3 世界全知道
Cryptoverse
探索不同網絡的 DApp,贏取各種獎勵
交易競技場
Cryptopedia
Giveaway
獎勵中心
Eco Hub
探索公鏈生態,鏈接無限未來
開發者中心
DEX API
通往鏈上流動性的入口
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
搜索地址、交易、區塊、代幣或 ENS
X Layer
一起探索和建設 X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
App、網頁端插件、Mini 錢包
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
行情
熱門代幣
掃鏈
牛人榜
信號
追蹤
DEX
幣幣兌換
專業交易
DeFi
市場
發現
洞察中心
Cryptoverse
Eco Hub
開發者中心
DEX API
區塊鏈瀏覽器
X Layer
DApp 連接錢包
語言
貨幣
下載 OKX Wallet
Web3 指南
洞察中心
Cryptoverse
交易競技場
Cryptopedia
Giveaway
Eco hub
探索 Web3 Giveaway 活動,每週豐厚獎勵等您來領取
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+2.03%
USELESS
-4.66%
IKUN
+21.62%
gib
+18.44%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+4.19%
ALON
+8.52%
LAUNCHCOIN
-0.67%
GOONC
+3.93%
KLED
+1.97%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+3.77%
Boopa
+0.06%
PORK
+20.9%
主頁
Nathan Lambert
弄清楚 AI @allen_ai、開放模型、RLHF、微調等 通過電子郵件聯繫。 寫入 @interconnectsai 撰寫了 RLHF 書 山地跑步者
更多
以上內容由 AI 進行翻譯,點擊顯示原文。
Nathan Lambert
8 小時前
我從不帶手機中獲得了很多心理清晰和內心平靜: 1. 在臥室裡睡覺, 2. 與朋友在家附近/工作時用餐、喝咖啡或吃零食。 這兩者都非常簡單,值得一試。
更多
5.74K
98
Nathan Lambert
20 小時前
供您娛樂 :)
更多
AI Engineer
7月20日 05:31
🆕 發佈我們的整個 RL + 推理課程! 特色: • @willccbb,Prime Intellect • @GregKamradt,Arc Prize • @natolambert,AI2/Interconnects • @corbtt,OpenPipe • @achowdhery,Reflection • @ryanmart3n,Bespoke • @ChrSzegedy,Morph 特別提供 3 小時的工作坊: @danielhanchen 來自 Unsloth! 從這裡開始: 祝你週末愉快!感謝 @OpenPipeAI 的支持和主辦這個課程!
8.06K
79
Nathan Lambert
7月20日 07:09
為rlhf書籍添加一種可視化PPO目標的好方法。策略梯度的核心是L~ R*A(R=策略比率,A=優勢)。 使良好行為在一定程度上更有可能。 使不良行為在一定程度上更不可能。 min(...)和adv的符號決定了哪條線。
更多
8.48K
103
Nathan Lambert
7月20日 04:37
人們聲稱AI的下一個障礙是什麼? 首先我們數據不夠,然後強化學習無法在數學/代碼之外進行泛化,接下來是什麼? 唯一真正的障礙似乎是計算能力的可用性。
更多
33.12K
299
Nathan Lambert
7月20日 04:30
我有同樣的感覺,但我所推進的前沿是與每個人共享的,而不僅僅是幾家大型科技公司。
查看討論
54
Nathan Lambert
7月20日 00:40
這樣做的目的是為了避免心理戰,而不是要削弱一個明顯的重大技術成就,拜託,家人們,我不是AI的仇恨者。 回覆中有這麼多仇恨者。
更多
Nathan Lambert
7月19日 21:23
不會被OpenAI對新IMO金模型的模糊宣傳所迷惑,關於什麼“通用目的強化學習”和其他“突破”。谷歌也獲得了IMO金獎(比掌握AIME更難),但請記住,簡單的想法最容易擴展。
11.57K
106
Nathan Lambert
7月19日 21:28
我聊過的很多人對於Grok正在做的事情並不太擔心,因為他們知道Grok模型在發布幾週後總是會被遺忘 🪦 💀
更多
706
11
Nathan Lambert
7月19日 21:23
不會被OpenAI對新IMO金模型的模糊宣傳所迷惑,關於什麼“通用目的強化學習”和其他“突破”。谷歌也獲得了IMO金獎(比掌握AIME更難),但請記住,簡單的想法最容易擴展。
查看討論
112.63K
872
Nathan Lambert 已轉發
Krishna Kaasyap
7月19日 18:39
OpenAI 是否已經在這個實驗模型中實現了超長期的強化學習? 來自 @natolambert 的文章 "強化學習的下一步是什麼" 的截圖。 Nathan 在這篇文章中提到 - 當前的方法在訓練期間為數學或代碼問題生成 10K-100K 個標記的答案,而人們討論將下一代強化學習訓練應用於的問題將是每個答案 1M-100M 個標記。這涉及在一個回合中包裝多個推理調用、提示和與環境的互動,並根據這些更新策略。 也許這一突破是兩者的結合 - 超長期強化學習和將 TTC 擴展到每個答案 1M-100M 個標記!
更多
8.87K
58
Nathan Lambert
7月18日 05:32
大家都在從中國模型中提煉/訓練,這是否"不好"?雖然不直接不好,但這裡有一個很大的軟實力成分。 許多完成的內容在宣揚中國社會主義理想/中華人民共和國價值觀,這些觀念會滲透到未來的AI模型中/在互聯網上廣泛傳播。
查看討論
9.28K
99
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可
Uniswap
DEX
daos.fun
DeFi
PumpSwap
DEX
4
Pancake Swap
DeFi
DEX
質押
Yield
5
AutoShark Finance
DeFi
6
Beefy Finance
DeFi
7
Obric
DEX
8
KLAYswap
DeFi
DEX
質押
Yield
9
1inch Network
DeFi
DEX
流動性池
10
LayerZero
其他