Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

clem 🤗
Co-fondatore e CEO @HuggingFace 🤗 , la piattaforma aperta e collaborativa per i costruttori di intelligenza artificiale
clem 🤗 ha ripubblicato
Abbiamo appena rilasciato oltre 100 checkpoint intermedi e i nostri log di addestramento dal training di SmolLM3-3B.
Speriamo che questo possa essere utile ai ricercatori che lavorano su interpretazione meccanica, dinamiche di addestramento, RL e altri argomenti :)
Log di addestramento:
-> Perdita di addestramento abituale (il divario nella perdita è dovuto al cambiamento della miscela), grad_norm ecc..
-> Metriche per layer/blocco (norma l1/l2, media, min, max, curtosi)
Checkpoint:
-> pre-addestramento ogni 40k passi (94.4B token)
-> estensione del contesto lungo ogni 4k passi (9.4B token)
-> post-addestramento: SFT, mid-training, APO soup, esperto LC

11,26K
clem 🤗 ha ripubblicato
500k campioni di dati post-addestramento multilingue in 5 lingue: francese, spagnolo, italiano, tedesco e portoghese.
Per affrontare la mancanza di dataset post-addestramento multilingue, abbiamo creato questi campioni e abbiamo scoperto che migliorano le prestazioni su benchmark come Global MMLU, Belebele e Multi-IF.

5,76K
clem 🤗 ha ripubblicato
Domenica perfetta: ho appena usato Kimi-K2 di @Kimi_Moonshot per vibrare codice in un'app @Gradio! 🔥
Puoi usare lo "Anycoder" Space di @_akhaliq ospitato su @huggingface gratuitamente. È stato super veloce! 🤗
PS: Sono consapevole di usare Gradio per vibrare codice in un altro Gradio! Gioco di parole molto voluto qui! 😂

17,38K
clem 🤗 ha ripubblicato
Ecco perché abbiamo deciso di (1) rendere Cline open source e (2) non includere la rivendita delle inferenze nel nostro modello di business:
Quando controlli l'inferenza (le chiamate al modello AI) e noi costruiamo il sistema (il sistema che dirige quelle chiamate), nessuna delle due parti può oscurare ciò che sta accadendo.
Vedi esattamente quali modelli vengono chiamati, quanto contesto viene utilizzato, quali decisioni vengono prese. Non possiamo degradare silenziosamente le prestazioni per migliorare i margini perché stai pagando direttamente il fornitore di inferenze.
Questa separazione significa che abbiamo successo solo quando Cline diventa più capace. Non quando troviamo modi ingegnosi per ridurre il tuo utilizzo di token. Non quando indirizziamo a modelli più economici senza dirti nulla. Non quando limitiamo artificialmente le finestre di contesto.
Il risultato: Cline utilizza il modello giusto per ogni compito (come definito da te), integra qualsiasi strumento tu abbia bisogno tramite MCP e opera senza vincoli arbitrari. Ottieni accesso puro e non filtrato alle capacità dell'AI.
Abbiamo costruito in questo modo perché quando gli incentivi sono allineati correttamente, non hai bisogno di fidarti di noi. L'architettura stessa garantisce che stiamo lavorando verso lo stesso obiettivo: l'esperienza di codifica AI più potente possibile.
La conclusione è che Cline ti offre le migliori prestazioni possibili dai migliori modelli, punto.
153,11K
Principali
Ranking
Preferiti
On-chain di tendenza
Di tendenza su X
Principali fondi recenti
Più popolari