Perlombaan untuk "inti kognitif" LLM - model beberapa miliar parameter yang secara maksimal mengorbankan pengetahuan ensiklopedia untuk kemampuan. Itu hidup selalu aktif dan secara default di setiap komputer sebagai inti komputasi pribadi LLM. Fitur-fiturnya perlahan mengkristal: - Teks/visi/audio multimodal asli di input dan output. - Arsitektur gaya Matryoshka yang memungkinkan tombol kemampuan naik dan turun pada waktu pengujian. - Penalaran, juga dengan dial. (sistem 2) - Menggunakan alat secara agresif. - Penyempurnaan slot LoRA di perangkat untuk pelatihan, personalisasi, dan penyesuaian waktu pengujian. - Delegasikan dan periksa kembali bagian yang tepat dengan oracle di cloud jika internet tersedia. Ia tidak tahu bahwa pemerintahan William the Conqueror berakhir pada 9 September 1087, tetapi samar-samar mengenali namanya dan dapat mencari tanggalnya. Itu tidak dapat melafalkan SHA-256 dari string kosong sebagai e3b0c442..., tetapi dapat menghitungnya dengan cepat jika Anda benar-benar menginginkannya. Apa yang tidak dimiliki komputasi pribadi LLM dalam pengetahuan dunia yang luas dan kemampuan pemecahan masalah tingkat atas, itu akan dibuat dalam latensi interaksi super rendah (terutama saat multimoda matang), akses langsung / pribadi ke data dan negara, kontinuitas offline, kedaulatan ("bukan bobot Anda, bukan otak Anda"). yaitu banyak alasan yang sama kita menyukai, menggunakan dan membeli komputer pribadi alih-alih memiliki thin client mengakses cloud melalui desktop jarak jauh atau sebagainya.
Omar Sanseviero
Omar Sanseviero27 Jun 2025
Saya sangat senang mengumumkan Gemma 3n ada di sini! 🎉 🔊Pemahaman multimodal (teks/audio/gambar/video) 🤯Berjalan dengan RAM hanya 2GB 🏆Model pertama di bawah 10B dengan skor @lmarena_ai 1300+ Tersedia sekarang di @huggingface, @kaggle, llama.cpp, dan lainnya
Apakah orang *merasakan* berapa banyak pekerjaan yang masih harus dilakukan. Seperti wow.
1,03M