跳轉至主要內容
行情
熱門代幣
探索熱門代幣排名,掌握最新市場動態
掃鏈
跟蹤由 Pump.Fun 等平臺推出的最新熱門 Meme 幣
牛人榜
排行、跟蹤並分析熱門交易地址
信號
獲取實時信號,解鎖市場洞察
追蹤
追蹤你最喜歡的代幣和錢包地址
DEX
幣幣兌換
交易聚合器,多路徑選擇,自由換幣
專業交易
深度數據分析,進階交易設置,為鏈上玩家打造
DeFi
市場
發現
洞察中心
Web3 世界全知道
Cryptoverse
探索不同網絡的 DApp,贏取各種獎勵
交易競技場
Cryptopedia
Giveaway
獎勵中心
Eco Hub
探索公鏈生態,鏈接無限未來
開發者中心
DEX API
通往鏈上流動性的入口
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
搜索地址、交易、區塊、代幣或 ENS
X Layer
一起探索和建設 X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
App、網頁端插件、Mini 錢包
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
行情
熱門代幣
掃鏈
牛人榜
信號
追蹤
DEX
幣幣兌換
專業交易
DeFi
市場
發現
洞察中心
Cryptoverse
Eco Hub
開發者中心
DEX API
區塊鏈瀏覽器
X Layer
DApp 連接錢包
語言
貨幣
下載 OKX Wallet
Web3 指南
洞察中心
Cryptoverse
交易競技場
Cryptopedia
Giveaway
Eco hub
探索 Momentum 生態,瓜分 $101.5 萬獎勵
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+10.87%
USELESS
-11.86%
IKUN
-10.58%
gib
-7.87%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-4.08%
ALON
+6.15%
LAUNCHCOIN
-8.7%
GOONC
-0.93%
KLED
-4.87%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-2.09%
Boopa
-3.2%
PORK
-9.91%
主頁
jack morris
研究@meta @cornell / 語言模型、資訊論、人工智慧科學
更多
以上內容由 AI 進行翻譯,點擊顯示原文。
jack morris
8月2日 02:22
我還沒聽到有人討論過,但人工智慧基本上已經殺死了黑客馬拉松。 2019年在黑客馬拉松上你可能做的任何東西,在2025年都可以由人工智慧更好、更快地構建。
更多
181.5K
2.62K
jack morris
8月2日 01:23
這是壞代碼對吧?
更多
20.42K
121
jack morris
8月1日 04:12
可能有10倍的人應該專注於提示優化 系統(我們需要一個vLLM來進行提示優化)、理論、新技術、基準測試。整個套件和配件
更多
30.37K
297
jack morris
8月1日 00:51
這裡有一些免費的資訊: 如果我們在預訓練後進行強化學習(RL)太久,我們肯定會覆蓋參數並開始遺忘一些東西。 在原始的 instructGPT 論文中,他們的最佳模型將 RLHF 與預訓練梯度混合,以避免這種模型漂移問題。 然而,現在沒有人再這樣做了。當然,這是一個特定的實現(梯度混合),但它是更廣泛想法(避免遺忘)的具體例子,但隨著我們進行越來越多的 RL 步驟,這似乎是一個被大大忽視的思路。 例如,請參見最近的 ProRL 論文。他們現在進行超過 1000 步的 GRPO,使用非平凡的學習率,並且對偏離原始模型沒有懲罰。預訓練期間在模型內部建立的電路肯定開始衰退。如果沒有,經過 10,000 或 100,000 步的 RL 後,它們將會衰退。 我懷疑這個想法最終會回來;他們可能已經在大型實驗室中這樣做了。
更多
54.79K
804
jack morris
2025年7月31日
我在尋找推理模型泛化的好例子 例如,一個通過強化學習激勵的模型,經過一段時間思考並解決數學問題後,竟然在創意寫作方面變得更好 這種情況常見嗎?
更多
21.75K
213
jack morris
2025年7月31日
這似乎真的很重要: 在給定一個完美設計的提示的情況下,模型完全有可能在沒有 *任何* 強化學習的情況下獲得 IMO 金牌。 我們只是不知道,並且缺乏有效搜索提示空間的工具。很高興看到至少有人在嘗試。
更多
Lakshya A Agrawal
2025年7月29日
提示優化與像 GRPO 這樣的強化學習算法相比如何? GRPO 需要數千次的回合,但人類可以從幾次試驗中學習——通過反思什麼有效和什麼無效。 介紹 GEPA:一種反思性提示優化器,能夠以少達 35 倍的回合數超越 GRPO,最多可提高 20% 的表現!🧵
38.32K
427
jack morris
2025年7月30日
你無法編造這些東西
更多
407.78K
5.61K
jack morris
2025年7月29日
假設情況 - 我是一家人工智慧公司,已將轉移和儲存模型的成本降至零。我可以為每位用戶提供他們自己的模型,沒有任何開銷。 我該怎麼做?直接在用戶的數據上進行用戶特定模型的SFT?還是基於聊天評分進行RLHF?還是其他什麼?
更多
16.59K
211
jack morris
2025年7月29日
人類大腦將 40% 的處理能力專門用於視覺。現代的 LLM 以某種方式完全沒有這一點進化。
更多
jack morris
2025年7月29日
令人非常驚訝的是,十五年的硬核計算機視覺研究對於AGI幾乎沒有貢獻,除了更好的優化器。 我們仍然沒有模型能在我們給它們眼睛時變得更聰明。
44.24K
487
jack morris 已轉發
Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭
2025年7月28日
我認識的一個傢伙(據說)用自我傳播的觸發激活的潛伏越獄載荷毒害了全球的AI訓練數據庫。
更多
471.71K
3.56K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可
Uniswap
DEX
daos.fun
DeFi
Pancake Swap
DeFi
DEX
質押
Yield
4
0x Protocol
DeFi
DEX
5
Bluefin AMM
DEX
6
1inch Network
DeFi
DEX
流動性池
7
Opensea
NFT 市場
8
Transit Swap
DEX
9
KyberSwap Classic
DeFi
DEX
Yield
流動性池
10
Across
DeFi