Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O Atropos v0.3 já está disponível!
Nossa estrutura de ambientes RL passou por muitas atualizações desde a v0.2 - alguns destaques:
- O Atropos agora pode ser usado como uma estrutura de benchmarking e avaliações pela @rogershijin, com nosso primeiro benchmark externo, Reward-Bench 2!
- Adicionado o Reasoning Gym, um repositório de ginásio de ambiente externo portado para átropos com mais de 100 tarefas de raciocínio de @neurosp1ke e amigos
- @max_paperclips integrou o bootcamp de raciocínio do @intern_lm, adicionando 1000+ novas tarefas de raciocínio para RL
- @dmayhem93 o engenheiro-chefe da Atropos adicionou dezenas de correções de bugs e outras melhorias de confiabilidade e compatibilidade, melhor suporte para vários ambientes e CI/CD
- Muitos dos ambientes de hackathon de Átropos foram mesclados em /environments/community - listá-los todos ocuparia a maior parte do espaço da tela, mas alguns destaques:
VR-CLI por @JakeABoggs, Filosofia RLAIF, Professores de LLM Adaptativo, WebVoyager, design de proteínas por @hallerite, um ambiente de roteamento de modelo por @gabinfay, vários em lean proving, a arena catbot, confronto de pokémon, pôquer, médicos prestativos, poesia sânscrita de @khoomeik e muito mais!
- Outros novos ambientes com suporte oficial notáveis incluem:
Formato de resposta seguindo o ambiente
Ambiente Pydantic para JSON portado do trabalho @MatternJustus
Instruções a seguir portadas do trabalho de @natolambert e @allen_ai
Contagem de letras
- 47 novos colaboradores!
Confira o changelog completo aqui:

18 de jul., 03:22
Just merged a PR for an environment to improve LLM as a Judge as well as evaluate models on their capability of doing judgements!
Did you know that all verifiable RL environments are nearly equivalent to benchmarks (and vice-versa!)? So we added an evaluate command to Atropos' base and now you can run benchmarks through Atropos environments.
We got frustrated with working with so many benchmark frameworks that were outdated or unusable, so we implemented evaluation-only mode into Atropos, our RL environments framework.
So our first port from outside our existing environments was @natolambert's Reward-Bench!
Note: it only supports generative reward models (regular LLM Judges) at the moment.
Check out the PR here:

24,87K
Melhores
Classificação
Favoritos