DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-3,36%

Boopa-9,59%

PORK-8,68%

Nous Research

Nous Research25 lug, 08:44

L'orario di apertura dell'ufficio Psyche inizia tra 20 minuti nel nostro Discord - Ci vediamo lì!

10,59K

Nous Research18 lug, 03:43

Atropos v0.3 è ora disponibile! Il nostro framework per ambienti RL ha visto molti aggiornamenti dalla v0.2 - alcuni punti salienti: - Atropos può ora essere utilizzato come framework di benchmarking e valutazioni da @rogershijin, con il nostro primo benchmark esterno, Reward-Bench 2! - Aggiunto il Reasoning Gym, un repository di ambienti esterni portato in Atropos con oltre 100 compiti di ragionamento da @neurosp1ke e amici. - @max_paperclips ha integrato il bootcamp di ragionamento di @intern_lm, aggiungendo oltre 1000 nuovi compiti di ragionamento per RL. - @dmayhem93, l'ingegnere capo di Atropos, ha aggiunto dozzine di correzioni di bug e altri miglioramenti di affidabilità e compatibilità, un migliore supporto per ambienti multipli e CI/CD. - Molti degli ambienti hackathon di Atropos sono stati fusi in /environments/community - elencarli tutti occuperebbe gran parte dello spazio dello schermo, ma alcuni punti salienti: VR-CLI di @JakeABoggs, Filosofia RLAIF, Insegnanti LLM Adattivi, WebVoyager, progettazione di proteine da @hallerite, un ambiente di routing dei modelli di @gabinfay, prove lean multiple, l'arena catbot, pokemon showdown, poker, dottori utili, poesia sanscrita di @khoomeik e molto altro! - Altri nuovi ambienti ufficialmente supportati includono: Formato di risposta seguente ambiente Ambiente Pydantic a JSON portato dal lavoro di @MatternJustus Seguire le istruzioni portato dal lavoro di @natolambert e @allen_ai Conteggio lettere - 47 nuovi collaboratori! Controlla il changelog completo qui:

Teknium (e/λ)18 lug, 03:22

Abbiamo appena fuso una PR per un ambiente per migliorare LLM come Giudice e valutare i modelli sulla loro capacità di fare giudizi! Sapevi che tutti gli ambienti RL verificabili sono quasi equivalenti ai benchmark (e viceversa!)? Quindi abbiamo aggiunto un comando di valutazione alla base di Atropos e ora puoi eseguire benchmark attraverso gli ambienti di Atropos. Ci siamo frustrati nel lavorare con così tanti framework di benchmark che erano obsoleti o inutilizzabili, quindi abbiamo implementato una modalità di sola valutazione in Atropos, il nostro framework per ambienti RL. Quindi il nostro primo porting da ambienti esterni è stato il Reward-Bench di @natolambert! Nota: al momento supporta solo modelli di ricompensa generativa (Giudici LLM regolari). Dai un'occhiata alla PR qui:

24,85K

Nous Research ha ripubblicato

John Galt16 lug, 10:12

Dataset Hermes 3, arte alternativa.

7,09K

Nous Research8 lug, 01:44

Una buona tecnologia genera esplorazione e meraviglia.

23,41K

Nous Research26 giu 2025

Strumenti open-source per le sfide umane.

PSYCHE0,00%

28,45K

Nous Research ha ripubblicato

Spencer Shumway7 giu 2025

È stato divertente lavorare con il team di @huggingface per trasformare questa funzione in realtà! Grazie per tutto il tuo lavoro e la tua creatività @pcuenq @reach_vb @julien_c @ariG23498 ! Grazie anche a @NousResearch @Teknium1 @Euclaise_ per essere stati i primi ad adottare i notebook per modelli personalizzati e per aver lavorato su questo con noi!

31,36K

Nous Research6 giu 2025

Fronte verso il nemico

PSYCHE0,00%

15,29K

Nous Research29 mag 2025

Nelle ultime settimane abbiamo apportato alcuni aggiornamenti alla nostra API e a NousChat: L'accesso alla nostra API di inferenza non è più in lista d'attesa: i nuovi utenti ottengono l'accesso immediato Hermes-3-Llama-3.1-405B è ora disponibile tramite l'API (oltre a Hermes-3-Llama-3.1-70B, DeepHermes-3-Llama-3-8B-Preview e DeepHermes-3-Mistral-24B-Preview) I limiti di velocità API sono stati raddoppiati (ora 100 giri/min e 80k tpm) E la nostra nuova esperienza di chat è in fase di lancio su Il tuo account di chat è collegato al tuo account in modo che i tuoi crediti API possano essere utilizzati per interagire con la chat.

PSYCHE0,00%

19,7K

Nous Research ha ripubblicato

Teknium (e/λ)27 mag 2025

Finalmente completato e unito l'ambiente SWE_RL descritto dall'articolo SWE RL di Meta in Atropos - Un ambiente davvero difficile che può insegnare a un modello ad essere un agente di codifica molto migliore! Dai un'occhiata al PR: Dai un'occhiata al documento SWE-RL di Meta:

11,71K

Nous Research ha ripubblicato

Auri24 mag 2025

6:39:00 Psyche potrebbe avere la missione più importante dell'intero panorama dell'IA

9,39K

Principali

Ranking

Preferiti

On-chain di tendenza

Di tendenza su X

Principali fondi recenti

Più popolari