Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Atropos v0.3 вже вийшов!
Наш фреймворк RL Environments зазнав багато оновлень, починаючи з версії 0.2 - деякі основні моменти:
- Atropos тепер може використовуватися як фреймворк для порівняльного аналізу та оцінок @rogershijin з нашим першим зовнішнім бенчмарком Reward-Bench 2!
- Додано Reasoning Gym, репозиторій для тренажерного залу зовнішнього середовища, портований на atropos з більш ніж 100 завданнями на міркування від @neurosp1ke та друзів
- @max_paperclips інтегрований буткемп міркувань @intern_lm, додавши 1000+ нових завдань на міркування для RL
- @dmayhem93 провідний інженер Atropos додав десятки виправлень помилок та інших покращень надійності та сумісності, кращу підтримку мультиоточення та CI/CD
- Багато середовищ хакатону Atropos були об'єднані в /environments/community - перерахування їх усіх зайняло б більшу частину екранного простору, але деякі особливості:
VR-CLI від @JakeABoggs, Philosophy RLAIF, Adaptive LLM Teachers, WebVoyager, білковий дизайн від @hallerite, модельне середовище маршрутизації від @gabinfay, множинне на lean proving, The Catbot Arena, Pokemon Showdown, покер, корисні лікарі, санскритська поезія від @khoomeik та багато іншого!
- Інші помітні офіційно підтримувані нові середовища включають:
Формат відповідей за оточенням
Середовище Pydantic на JSON портовано з @MatternJustus роботи
Інструкція Наступне перенесено з @natolambert та роботи @allen_ai
Підрахунок букв
- 47 нових дописувачів!
Ознайомтеся з повним журналом змін тут:

Teknium (e/λ)18 лип., 03:22
Щойно об'єднав PR для середовища для покращення LLM як судді, а також оцінки моделей щодо їх здатності робити судження!
Чи знаєте ви, що всі перевірені середовища RL майже еквівалентні бенчмаркам (і навпаки!)? Тому ми додали команду evaluate на базу Atropos і тепер ви можете запускати бенчмарки через середовища Atropos.
Нам було розчаровано працювати з такою кількістю тестових фреймворків, які були застарілими або непридатними для використання, тому ми впровадили режим лише оцінки в Atropos, наш фреймворк RL-середовищ.
Отже, нашим першим портом з-за меж нашого існуючого середовища став @natolambert's Reward-Bench!
Примітка: на даний момент він підтримує лише генеративні моделі винагороди (звичайні судді LLM).
Ознайомитися з PR можна тут:

24,86K
Користувач Nous Research поділився
Було весело працювати з командою @huggingface, щоб втілити цю функцію в реальність! Спасибі за всю вашу працю і творчість @pcuenq @reach_vb @julien_c @ariG23498 !
Також дякуємо @NousResearch @Teknium1 @Euclaise_ за те, що вони були першими користувачами кастомних моделей ноутбуків і працювали над цим разом з нами!
31,36K
За останні кілька тижнів ми оновили наш API та NousChat:
Доступ до нашого Inference API більше не стоїть за списком очікування: нові користувачі отримують миттєвий доступ
Hermes-3-Llama-3.1-405B тепер доступний через API (крім Hermes-3-Llama-3.1-70B, DeepHermes-3-Llama-3-8B-Preview та DeepHermes-3-Mistral-24B-Preview)
Ліміти швидкості API були збільшені вдвічі (тепер 100 об/хв та 80 тис tpm)
І наш новий досвід чату впроваджується за адресою
Ваш обліковий запис чату пов'язаний з вашим обліковим записом, тому ваші кредити API можуть бути використані для взаємодії з чатом.

19,71K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги