跳转至主要内容
行情
热门代币
探索热门代币排名,掌握最新市场动态
扫链
跟踪由 Pump.Fun 等平台推出的最新热门 Meme 币
牛人榜
排行、跟踪并分析热门交易地址
信号
获取实时信号,解锁市场洞察
追踪
追踪你最喜欢的代币和钱包地址
DEX
币币兑换
交易聚合器,多路径选择,自由换币
专业交易
深度数据分析,进阶交易设置,为链上玩家打造
DeFi
市场
发现
洞察中心
Web3 世界全知道
Cryptoverse
探索不同网络的 DApp,赢取各种奖励
交易竞技场
Cryptopedia
Giveaway
奖励中心
Eco Hub
探索公链生态,链接无限未来
开发者中心
DEX API
通往链上流动性的入口
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
搜索地址、交易、区块、代币或 ENS
X Layer
一起探索和建设 X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
App、网页端插件、Mini 钱包
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
行情
热门代币
扫链
牛人榜
信号
追踪
DEX
币币兑换
专业交易
DeFi
市场
发现
洞察中心
Cryptoverse
Eco Hub
开发者中心
DEX API
区块链浏览器
X Layer
DApp 连接钱包
语言
货币
下载 OKX Wallet
Web3 指南
洞察中心
Cryptoverse
交易竞技场
Cryptopedia
Giveaway
Eco hub
探索 Web3 Giveaway 活动,每周丰厚奖励等您来领取
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+2.03%
USELESS
-4.66%
IKUN
+21.62%
gib
+18.44%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+4.19%
ALON
+8.52%
LAUNCHCOIN
-0.67%
GOONC
+3.93%
KLED
+1.97%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+3.77%
Boopa
+0.06%
PORK
+20.9%
主页
Nathan Lambert
弄清楚 AI @allen_ai、开放模型、RLHF、微调等 通过电子邮件联系。 写入 @interconnectsai 撰写了 RLHF 书 山地跑步者
更多
查看原文
Nathan Lambert
8 小时前
我从不带手机中获得了很多心理清晰和内心平静: 1. 在卧室里睡觉, 2. 和朋友在家附近/工作时吃饭、喝咖啡或吃零食。 这两者都很简单,值得一试。
更多
5.74K
98
Nathan Lambert
20 小时前
供您娱乐 :)
更多
AI Engineer
7月20日 05:31
🆕 发布我们整个 RL + 推理课程! 特色: • @willccbb,Prime Intellect • @GregKamradt,Arc Prize • @natolambert,AI2/Interconnects • @corbtt,OpenPipe • @achowdhery,Reflection • @ryanmart3n,Bespoke • @ChrSzegedy,Morph 特别的 3 小时研讨会由: @danielhanchen 的 Unsloth 主办! 从这里开始: 祝周末愉快!感谢 @OpenPipeAI 的支持和主办这个课程!
8.06K
79
Nathan Lambert
7月20日 07:09
为rlhf书籍添加一种可视化PPO目标的好方法。策略梯度的核心是L~ R*A(R=策略比率,A=优势)。 在一定程度上使好的动作更可能。 在一定程度上使坏的动作更不可能。 adv的min(...)和&符号决定了哪一条线。
更多
8.48K
103
Nathan Lambert
7月20日 04:37
人们声称AI的下一个障碍是什么? 首先我们数据不够,然后强化学习无法在数学/代码之外进行推广,接下来是什么? 唯一真正的障碍似乎是计算能力的可用性。
更多
33.12K
299
Nathan Lambert
7月20日 04:30
我有同样的感觉,但我所推动的前沿是与每个人共享的,而不仅仅是一些大型科技公司。
查看讨论
55
Nathan Lambert
7月20日 00:40
这样做的目的是为了避免心理战,而不是削弱一个显而易见的重大技术成就,拜托,家人们,我不是一个讨厌人工智能的人。 回复中有这么多黑粉。
更多
Nathan Lambert
7月19日 21:23
不被OpenAI关于新IMO黄金模型的模糊宣传所迷惑,什么“通用目的RL”和其他“突破”。谷歌也获得了IMO黄金(比掌握AIME更难),但请记住,简单的想法最容易扩展。
11.57K
106
Nathan Lambert
7月19日 21:28
我聊过的很多人对Grok正在做的事情并不太担心,因为他们知道Grok模型在发布几周后总是被遗忘 🪦 💀
更多
707
11
Nathan Lambert
7月19日 21:23
不被OpenAI关于新IMO黄金模型的模糊宣传所迷惑,什么“通用目的RL”和其他“突破”。谷歌也获得了IMO黄金(比掌握AIME更难),但请记住,简单的想法最容易扩展。
查看讨论
112.63K
872
Nathan Lambert 已转发
Krishna Kaasyap
7月19日 18:39
OpenAI是否通过这个实验模型实现了超长回合的强化学习? 来自@natolambert关于“强化学习的下一步是什么”的文章的截图。 Nathan在这篇文章中提到 - 目前的方法在训练期间为数学或代码问题生成每个答案10K-100K个标记,而人们讨论将下一代强化学习训练应用于的问题将是每个答案1M-100M个标记。这涉及在一个回合中将多个推理调用、提示和与环境的交互包装在一起,以便对策略进行更新。 也许这个突破是两者的结合 - 超长回合的强化学习和将TTC扩展到每个答案1M-100M个标记!
更多
8.87K
58
Nathan Lambert
7月18日 05:32
大家都在从中国模型中提取/训练,这"不好"吗?虽然不直接不好,但有很大的软实力成分。 许多关于中国社会主义理想/中华人民共和国价值观的完成内容会过滤到未来的AI模型中/在互联网上传播。
查看讨论
9.28K
99
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可
Uniswap
DEX
daos.fun
DeFi
PumpSwap
DEX
4
Pancake Swap
DeFi
DEX
质押
Yield
5
AutoShark Finance
DeFi
6
Beefy Finance
DeFi
7
Obric
DEX
8
KLAYswap
DeFi
DEX
质押
Yield
9
1inch Network
DeFi
DEX
流动性池
10
LayerZero
其他