Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

clem 🤗
Co-founder & CEO @HuggingFace🤗, platform terbuka dan kolaboratif untuk pembangun AI
clem 🤗 memposting ulang
Kami baru saja merilis 100+ pos pemeriksaan menengah dan log pelatihan kami dari pelatihan SmolLM3-3B.
Kami berharap ini dapat bermanfaat bagi peneliti yang mengerjakan interpretasi mekanisme, dinamika pelatihan, RL, dan topik lainnya :)
Log pelatihan:
-> Kerugian pelatihan biasa (kesenjangan kerugian disebabkan oleh perubahan campuran), grad_norm dll.
-> Metrik per lapisan/blok (norma l1/l2, rata-rata, min, maks, kurtosis)
Pos pemeriksaan:
-> pra-pelatihan setiap langkah 40 ribu (token 94,4 miliar)
-> ekstensi konteks panjang setiap langkah 4k (token 9,4 miliar)
-> pasca-pelatihan: SFT, mid-training, sup APO, pakar LC

11,26K
clem 🤗 memposting ulang
500 ribu sampel data pasca-pelatihan multibahasa dalam 5 bahasa: Prancis, Spanyol, Italia, Jerman, dan Portugis.
Untuk mengatasi kurangnya kumpulan data pasca-pelatihan multibahasa, kami membuat sampel ini dan menemukan bahwa mereka meningkatkan kinerja pada tolok ukur seperti Global MMLU, Belebele, dan Multi-IF

5,76K
clem 🤗 memposting ulang
Minggu yang sempurna: Saya baru saja menggunakan Kimi-K2 oleh @Kimi_Moonshot untuk menggetarkan kode aplikasi @Gradio! 🔥
Anda dapat menggunakan Ruang "Anycoder" oleh @_akhaliq yang dihosting di @huggingface secara gratis. Itu sangat cepat! 🤗
PS: Saya sadar menggunakan Gradio untuk menggetarkan kode Gradio lain! Permainan kata-kata sangat dimaksudkan di sini! 😂

17,38K
clem 🤗 memposting ulang
Inilah mengapa kami memutuskan untuk (1) membuat Cline open source dan (2) tidak membuat inferensi menjual kembali sebagai bagian dari model bisnis kami:
Ketika Anda mengontrol inferensi (model AI memanggil) dan kami membangun harness (sistem yang mengarahkan panggilan tersebut), tidak ada pihak yang dapat mengaburkan apa yang terjadi.
Anda melihat dengan tepat model mana yang dipanggil, berapa banyak konteks yang digunakan, keputusan apa yang dibuat. Kami tidak dapat menurunkan performa secara diam-diam untuk meningkatkan margin karena Anda membayar penyedia inferensi secara langsung.
Pemisahan ini berarti kita berhasil hanya ketika Cline menjadi lebih mampu. Tidak ketika kami menemukan cara cerdas untuk mengurangi penggunaan token Anda. Tidak ketika kami merutekan ke model yang lebih murah tanpa memberi tahu Anda. Tidak ketika kita secara artifisial membatasi jendela konteks.
Hasilnya: Cline menggunakan model yang tepat untuk setiap tugas (seperti yang Anda tentukan), mengintegrasikan alat apa pun yang Anda butuhkan melalui MCP, dan beroperasi tanpa batasan sewenang-wenang. Anda mendapatkan akses murni tanpa filter ke kemampuan AI.
Kami membangun dengan cara ini karena ketika insentif selaras dengan benar, Anda tidak perlu mempercayai kami. Arsitektur itu sendiri menjamin kami bekerja menuju tujuan yang sama: pengalaman pengkodean AI yang paling kuat.
Intinya adalah bahwa Cline memberi Anda kinerja terbaik dari model terbaik, titik penuh.
153,11K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal