跳转至主要内容
行情
热门代币
探索热门代币排名,掌握最新市场动态
扫链
跟踪由 Pump.Fun 等平台推出的最新热门 Meme 币
牛人榜
排行、跟踪并分析热门交易地址
信号
获取实时信号,解锁市场洞察
追踪
追踪你最喜欢的代币和钱包地址
DEX
币币兑换
交易聚合器,多路径选择,自由换币
专业交易
深度数据分析,进阶交易设置,为链上玩家打造
DeFi
市场
发现
洞察中心
Web3 世界全知道
Cryptoverse
探索不同网络的 DApp,赢取各种奖励
交易竞技场
Cryptopedia
Giveaway
奖励中心
Eco Hub
探索公链生态,链接无限未来
开发者中心
DEX API
通往链上流动性的入口
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
搜索地址、交易、区块、代币或 ENS
X Layer
一起探索和建设 X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
App、网页端插件、Mini 钱包
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
行情
热门代币
扫链
牛人榜
信号
追踪
DEX
币币兑换
专业交易
DeFi
市场
发现
洞察中心
Cryptoverse
Eco Hub
开发者中心
DEX API
区块链浏览器
X Layer
DApp 连接钱包
语言
货币
下载 OKX Wallet
Web3 指南
洞察中心
Cryptoverse
交易竞技场
Cryptopedia
Giveaway
Eco hub
探索 Momentum 生态,瓜分 $101.5 万奖励
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-0.2%
USELESS
-20.43%
IKUN
-16.36%
gib
-24.02%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-7.54%
ALON
+0.2%
LAUNCHCOIN
-8.26%
GOONC
+1.09%
KLED
+0.68%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.73%
Boopa
-6.75%
PORK
-4.65%
主页
jack morris
研究@meta @cornell // 语言模型、信息论、人工智能科学
更多
查看原文
jack morris
23 小时前
我还没有听说过这个话题,但人工智能基本上杀死了黑客马拉松。2019年在黑客马拉松上你可能制作的任何东西,在2025年都可以由人工智能更好更快地构建。
更多
149.68K
2.26K
jack morris
8月2日 01:23
这段代码很糟糕,对吧?
更多
17.97K
108
jack morris
8月1日 04:12
可能有10倍的人应该致力于提示优化 系统(我们需要一个vLLM用于提示优化)、理论、新技术、基准测试。整个工具包和一切。
更多
30.37K
297
jack morris
8月1日 00:51
这里有一些免费的内幕消息: 如果我们在预训练后进行强化学习(RL)太久,我们肯定会覆盖参数并开始遗忘一些东西。 在原始的 instructGPT 论文中,他们的最佳模型将 RLHF 与预训练梯度混合,以避免这种模型漂移问题。 然而,现在没有人再这样做了。 当然,这是一种特定的实例(梯度混合),属于一个更广泛的想法(避免遗忘),但随着我们进行越来越多的 RL 步骤,这似乎是一个被极大忽视的思路。 例如,看看最近的 ProRL 论文。他们现在进行超过 1000 步的 GRPO,使用非平凡的学习率,并且没有对偏离原始模型的惩罚。 在预训练期间模型内部构建的电路肯定开始衰退。如果没有,经过 10k 或 100k RL 步骤后,它们将会衰退。 我怀疑这个想法最终会重新回归;他们可能已经在大实验室中这样做了。
更多
51.15K
765
jack morris
2025年7月31日
我在寻找推理模型泛化的好例子。 例如,一个通过强化学习激励的模型,经过一段时间的思考并解决数学问题后,竟然在创意写作方面变得更好。 这种情况常见吗?
更多
21.74K
213
jack morris
2025年7月31日
这似乎真的很重要: 在给定一个完美设计的提示的情况下,模型完全有可能在没有 *任何* 强化学习的情况下获得 IMO 金牌。 我们只是不知道,并且缺乏有效搜索提示空间的工具。很高兴看到至少有人在尝试。
更多
Lakshya A Agrawal
2025年7月29日
提示优化与像 GRPO 这样的强化学习算法相比如何? GRPO 需要数千次的回合,但人类可以通过反思什么有效和什么无效,从少量的试验中学习。 认识 GEPA:一种反思性提示优化器,可以在减少 35 倍回合的情况下,超越 GRPO 达到 20% 的提升!🧵
38.31K
427
jack morris
2025年7月30日
你无法编造这些东西
更多
407.77K
5.61K
jack morris
2025年7月29日
假设情况 - 我是一家人工智能公司,已经将转移和存储模型的成本降低到零。我可以为每个用户提供他们自己的模型,没有任何开销。 我该怎么做?直接在用户的数据上进行用户特定模型的SFT?还是在聊天评分上进行RLHF?或者其他什么?
更多
16.59K
211
jack morris
2025年7月29日
人类大脑将40%的处理能力专门用于视觉。现代大型语言模型在某种程度上完全没有这一点。
更多
jack morris
2025年7月29日
令人非常惊讶的是,十五年的硬核计算机视觉研究几乎没有为AGI做出贡献,除了更好的优化器。 我们仍然没有模型能够在我们给它们眼睛时变得更聪明。
44.24K
487
jack morris 已转发
Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭
2025年7月28日
我认识的一个家伙(据说)用自我传播的触发激活的潜伏越狱载荷毒害了全球AI训练数据集。
更多
471.7K
3.56K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可
Uniswap
DEX
daos.fun
DeFi
Pancake Swap
DeFi
DEX
质押
Yield
4
0x Protocol
DeFi
DEX
5
Bluefin AMM
DEX
6
Meteora
DeFi
7
1inch Network
DeFi
DEX
流动性池
8
Opensea
NFT 市场
9
Transit Swap
DEX
10
KyberSwap Classic
DeFi
DEX
Yield
流动性池