DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP+5,6%

Boopa+18,13%

PORK+20,25%

clem 🤗

Co-fondatore e CEO @HuggingFace 🤗 , la piattaforma aperta e collaborativa per i costruttori di intelligenza artificiale

clem 🤗34 minuti fa

Ci sarebbe un modo per le grandi aziende tecnologiche di "donare" le ore inutilizzate sui loro enormi cluster GPU agli scienziati aperti e agli sviluppatori di intelligenza artificiale open-source? Potrebbe accumularsi in somme significative messe a buon uso?

2,05K

clem 🤗 ha ripubblicato

Zephyr2 ore fa

Quindi Qwen ottiene anche la designazione di laboratorio di frontiera ora?? @xeophon_ @Presidentlin

2,16K

clem 🤗 ha ripubblicato

Vaibhav (VB) Srivastav3 ore fa

Qwen COOKED - supera Kimi K2 ed è competitivo con Claude Opus 4 al 25% dei parametri totali 🤯

1,71K

clem 🤗 ha ripubblicato

Casper Hansen3 ore fa

Questo non è un piccolo aggiornamento. È enorme! Per favore, dateci questo per ogni modello, team Qwen🙏

7,08K

clem 🤗 ha ripubblicato

elie5 ore fa

Abbiamo appena rilasciato oltre 100 checkpoint intermedi e i nostri log di addestramento dal training di SmolLM3-3B. Speriamo che questo possa essere utile ai ricercatori che lavorano su interpretazione meccanica, dinamiche di addestramento, RL e altri argomenti :) Log di addestramento: -> Perdita di addestramento abituale (il divario nella perdita è dovuto al cambiamento della miscela), grad_norm ecc.. -> Metriche per layer/blocco (norma l1/l2, media, min, max, curtosi) Checkpoint: -> pre-addestramento ogni 40k passi (94.4B token) -> estensione del contesto lungo ogni 4k passi (9.4B token) -> post-addestramento: SFT, mid-training, APO soup, esperto LC

11,26K

clem 🤗 ha ripubblicato

Loubna Ben Allal7 ore fa

500k campioni di dati post-addestramento multilingue in 5 lingue: francese, spagnolo, italiano, tedesco e portoghese. Per affrontare la mancanza di dataset post-addestramento multilingue, abbiamo creato questi campioni e abbiamo scoperto che migliorano le prestazioni su benchmark come Global MMLU, Belebele e Multi-IF.

5,76K

clem 🤗 ha ripubblicato

🤷 Nico Martin15 ore fa

Oltre a essere felice di annunciare che mi unisco 🤗 a @huggingface come #MachineLearningEngineer focalizzato su #WebML!

19,54K

clem 🤗21 lug, 00:28

1.000.000 🤗

52,94K

clem 🤗 ha ripubblicato

Maziyar PANAHI20 lug, 17:55

Domenica perfetta: ho appena usato Kimi-K2 di @Kimi_Moonshot per vibrare codice in un'app @Gradio! 🔥 Puoi usare lo "Anycoder" Space di @_akhaliq ospitato su @huggingface gratuitamente. È stato super veloce! 🤗 PS: Sono consapevole di usare Gradio per vibrare codice in un altro Gradio! Gioco di parole molto voluto qui! 😂

17,38K

clem 🤗 ha ripubblicato

Cline20 lug, 06:49

Ecco perché abbiamo deciso di (1) rendere Cline open source e (2) non includere la rivendita delle inferenze nel nostro modello di business: Quando controlli l'inferenza (le chiamate al modello AI) e noi costruiamo il sistema (il sistema che dirige quelle chiamate), nessuna delle due parti può oscurare ciò che sta accadendo. Vedi esattamente quali modelli vengono chiamati, quanto contesto viene utilizzato, quali decisioni vengono prese. Non possiamo degradare silenziosamente le prestazioni per migliorare i margini perché stai pagando direttamente il fornitore di inferenze. Questa separazione significa che abbiamo successo solo quando Cline diventa più capace. Non quando troviamo modi ingegnosi per ridurre il tuo utilizzo di token. Non quando indirizziamo a modelli più economici senza dirti nulla. Non quando limitiamo artificialmente le finestre di contesto. Il risultato: Cline utilizza il modello giusto per ogni compito (come definito da te), integra qualsiasi strumento tu abbia bisogno tramite MCP e opera senza vincoli arbitrari. Ottieni accesso puro e non filtrato alle capacità dell'AI. Abbiamo costruito in questo modo perché quando gli incentivi sono allineati correttamente, non hai bisogno di fidarti di noi. L'architettura stessa garantisce che stiamo lavorando verso lo stesso obiettivo: l'esperienza di codifica AI più potente possibile. La conclusione è che Cline ti offre le migliori prestazioni possibili dai migliori modelli, punto.

153,11K

Principali

Ranking

Preferiti

On-chain di tendenza

Di tendenza su X

Principali fondi recenti

Più popolari