トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Atropos v0.3 がリリースされました!
当社のRL環境フレームワークは、v0.2以降、多くのアップグレードが行われてきました。
- Atroposは、@rogershijin初の外部ベンチマークであるReward-Bench 2により、ベンチマークおよび評価フレームワークとして使用できるようになりました。
- @neurosp1keや友人による100以上の推理タスクを備えた外部環境ジムリポジトリであるReasoningGymを追加しました
- @max_paperclips @intern_lmの推論ブートキャンプを統合し、RLに1000+の新しい推論タスクを追加
- @dmayhem93、Atroposのリードエンジニアは、数十のバグ修正、その他の信頼性と互換性の改善、マルチ環境のサポートの改善、CI/CDを追加しました。
- Atroposのハッカソン環境の多くは/environments/communityに統合されました - それらをすべてリストアップすると、画面スペースの大部分を占めてしまいますが、いくつかのハイライトがあります。
@JakeABoggsによるVR-CLI、Philosophy RLAIF、Adaptive LLM Teachers、WebVoyager、@halleriteによるタンパク質設計、@gabinfayによるモデルルーティング環境、リーンプルーフィングのマルチプルーフィング、キャットボットアリーナ、ポケモン対決、ポーカー、親切な医者、@khoomeikによるサンスクリット語の詩など、盛りだくさんです。
- その他の注目すべき公式にサポートされている新しい環境は次のとおりです。
環境に応じた回答形式
PydanticからJSON環境に移植された@MatternJustus作品
@natolambertと@allen_aiの作品から移植された指示フォロー
レターカウンティング
- 47人の新しい貢献者!
ここで完全な変更ログを確認してください。

Teknium (e/λ)7月18日 03:22
ジャッジとしてのLLMを向上させるための環境のPRを統合し、モデルのジャッジ能力を評価しました!
すべての検証可能なRL環境はベンチマークとほぼ同等であることをご存知ですか(その逆も同様です)。そこで、Atroposのベースに評価コマンドを追加し、Atropos環境を通じてベンチマークを実行できるようになりました。
私たちは、古いまたは使用できない多くのベンチマークフレームワークを扱うことに不満を感じていたため、RL環境フレームワークであるAtroposに評価専用モードを実装しました。
そこで、既存の環境の外部からの最初の移植は、@natolambertのReward-Benchでした。
注:現時点では、生成報酬モデル(通常のLLMジャッジ)のみをサポートしています。
ここでPRをチェックしてください:

24.86K
過去数週間で、APIとNousChatにいくつかの更新を行いました。
Inference APIへのアクセスは、もはや順番待ちリストに載ることはなく、新規ユーザーはすぐにアクセスできます
Hermes-3-Llama-3.1-405B が API 経由で利用可能になりました (Hermes-3-Llama-3.1-70B、DeepHermes-3-Llama-3-8B-Preview、DeepHermes-3-Mistral-24B-Preview に加えて)
API レート制限が 2 倍になりました (現在は 100rpm と 80k tpm)。
そして、私たちの新しいチャット体験は、
そこでのチャットアカウントは、APIクレジットを使用してチャットと対話できるように、アカウントにリンクされています。

19.71K
トップ
ランキング
お気に入り
Trending onchain
Trending on X
Recent top fundings
Most notable