LLM「認知核心」的競賽 - 幾十億個參數模型,它最大限度地犧牲了百科全書式的知識來換取能力。它始終處於開啟狀態,並且預設情況下作為 LLM 個人計算的內核存在於每台計算機上。 它的特點正在慢慢具體化: - 輸入和輸出的本地多模態文本/視覺/音訊。 - 俄羅斯套娃式架構允許在測試時上下調整功能。 - 推理,也用表盤。(系統 2) - 積極使用工具。 - 設備上微調 LoRA 插槽,用於考試時訓練、個人化和自定義。 - 如果互聯網可用,則使用雲中的 oracle 委派並仔細檢查正確的部分。 它不知道征服者威廉的統治於 1087 年 9 月 9 日結束,但它模糊地認出這個名字,並且可以查找日期。它不能將空字串的SHA-256背誦為 e3b0c442...,但如果你真的需要它,它可以快速計算它。 LLM 個人計算缺乏廣泛的世界知識和頂級的問題解決能力,它將通過超低交互延遲(尤其是隨著多模態的成熟)、對數據和狀態的直接/私有訪問、離線連續性、主權(“不是你的重量不是你的大腦”)來彌補。即,我們喜歡使用和購買個人計算機而不是讓瘦用戶端通過遠端桌面等訪問雲的許多相同原因。
Omar Sanseviero
Omar Sanseviero2025年6月27日
我很高興地宣佈 Gemma 3n 來了!🎉 🔊 多模態(文字/音訊/圖像/視頻)理解 🤯 只需 2GB 的 RAM 即可運行 🏆 首款 10B 以下的車型@lmarena_ai得分為 1300+ 現已在 @huggingface、@kaggle、llama.cpp 等平臺上推出
人們是否*感覺到*還有多少工作要做。就像哇。
1.03M