一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动 | OKX Wallet

区块链浏览器

DApp 连接钱包

下载 OKX Wallet Web3 指南

交易竞技场

探索 Momentum 生态，瓜分 $101.5 万奖励

background background

discoveryBanners

热门话题

#

Bonk 生态迷因币展现强韧势头

#

有消息称 Pump.fun 计划 40 亿估值发币，引发市场猜测

LAUNCHCOIN+9.99%

#

Solana 新代币发射平台 Boop.Fun 风头正劲

header

Nous Research

Nous Research

Nous Research7月25日 08:44

Psyche 办公时间将在 20 分钟后在我们的 Discord 上开始 - 到时见！

10.59K

Nous Research

Nous Research7月18日 03:43

Atropos v0.3 现已发布！我们的 RL 环境框架自 v0.2 以来进行了许多升级 - 一些亮点： - Atropos 现在可以作为基准测试和评估框架，由 @rogershijin 提供支持，首个外部基准测试 Reward-Bench 2！ - 添加了推理健身房，这是一个外部环境健身房库，移植到 Atropos 中，包含 @neurosp1ke 和朋友们提供的 100 多个推理任务。 - @max_paperclips 集成了 @intern_lm 的推理训练营，为 RL 添加了 1000 多个新的推理任务。 - Atropos 的首席工程师 @dmayhem93 添加了数十个错误修复和其他可靠性与兼容性改进，更好地支持多环境和 CI/CD。 - 许多 Atropos 黑客马拉松环境已合并到 /environments/community - 列出所有环境将占用大部分屏幕空间，但一些亮点包括：由 @JakeABoggs 提供的 VR-CLI，哲学 RLAIF，自适应 LLM 教师，WebVoyager，由 @hallerite 提供的蛋白质设计，由 @gabinfay 提供的模型路由环境，多种精益证明，猫机器人竞技场，宝可梦对战，扑克，乐于助人的医生，由 @khoomeik 提供的梵文诗歌等等！ - 其他值得注意的官方支持的新环境包括：遵循环境的答案格式从 @MatternJustus 的工作移植的 Pydantic 到 JSON 环境从 @natolambert 和 @allen_ai 的工作移植的指令遵循字母计数 - 47 位全新贡献者！在这里查看完整的更新日志：

Teknium (e/λ)

Teknium (e/λ)7月18日 03:22

刚合并了一个PR，为环境改进LLM作为法官，并评估模型的判断能力！你知道所有可验证的RL环境几乎等同于基准（反之亦然）吗？所以我们在Atropos的基础上添加了一个评估命令，现在你可以通过Atropos环境运行基准测试。我们对使用那么多过时或不可用的基准框架感到沮丧，因此我们在Atropos中实现了仅评估模式，这是我们的RL环境框架。所以我们从现有环境之外的第一个移植是@natolambert的Reward-Bench！注意：目前它仅支持生成奖励模型（常规LLM法官）。在这里查看PR：

24.84K

Nous Research 已转发

John Galt

John Galt7月16日 10:12

Hermes 3 数据集，替代艺术。

7.09K

Nous Research

Nous Research7月8日 01:44

优秀的技术激发探索和惊奇。

23.41K

Nous Research

Nous Research2025年6月26日

应对人类挑战的开源工具。

28.45K

Nous Research 已转发

Spencer Shumway

Spencer Shumway2025年6月7日

与 @huggingface 团队合作使这个功能成为现实非常有趣！感谢你们的努力和创造力 @pcuenq @reach_vb @julien_c @ariG23498！同时也感谢 @NousResearch @Teknium1 @Euclaise_ 成为自定义模型笔记本的早期采用者，并与我们一起进行这项工作！

31.36K

Nous Research

Nous Research2025年6月6日

面向敌人

15.29K

Nous Research

Nous Research2025年5月29日

我们在过去几周对我们的API和NousChat进行了更新：我们的推理API不再需要等待名单：新用户可以立即访问 Hermes-3-Llama-3.1-405B现在可以通过API使用（除了Hermes-3-Llama-3.1-70B、DeepHermes-3-Llama-3-8B-Preview和DeepHermes-3-Mistral-24B-Preview） API速率限制已翻倍（现在为100rpm和80k tpm）我们的新聊天体验正在推出您的聊天账户与您的账户链接，因此您的API积分可以用于与聊天互动。

19.7K

Nous Research 已转发

Teknium (e/λ)

Teknium (e/λ)2025年5月27日

终于完成并合并了 Meta 的 SWE RL 论文中描述的 SWE_RL 环境到 Atropos——一个非常困难的环境，可以教会模型成为更优秀的编码代理！查看 PR：查看 Meta 的 SWE-RL 论文：

11.71K

Nous Research 已转发

Auri

Auri2025年5月24日

6:39:00 Psyche 可能是整个人工智能领域中最具影响力的任务之一

9.39K

热门

排行

收藏

链上热点

X 热门榜

近期融资

最受认可

©2017 - 2025 WEB3.OKX.COM

简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

关于 OKX Web3

关于我们就业机会联系我们服务条款隐私政策

产品

资产看板币币兑换市场赚币发现开发者中心

用户支持

帮助中心官方渠道验证公告加入 OKX 社群