热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
LLM "认知核心" 的竞争 - 一个几亿参数的模型,最大限度地牺牲百科知识以换取能力。它始终在线,并默认在每台计算机上作为 LLM 个人计算的内核存在。
它的特性正在慢慢成型:
- 原生多模态文本/视觉/音频输入和输出。
- 瓦尔特式架构,允许在测试时调节能力。
- 推理,也可以调节。(系统 2)
- 积极使用工具。
- 设备上的微调 LoRA 插槽,用于测试时训练、个性化和定制。
- 如果有互联网可用,委托并双重检查云中的正确部分。
它不知道威廉征服者的统治在 1087 年 9 月 9 日结束,但它模糊地识别这个名字,并可以查找日期。它不能背诵空字符串的 SHA-256 为 e3b0c442...,但如果你真的想要,它可以快速计算出来。
LLM 个人计算在广泛的世界知识和顶级问题解决能力上有所欠缺,但它将在超低交互延迟(尤其是多模态成熟时)、直接/私密的数据和状态访问、离线连续性、主权(“不是你的权重,不是你的大脑”)等方面弥补。即:我们喜欢、使用和购买个人计算机而不是通过远程桌面访问云的许多相同原因。

2025年6月27日
我很高兴地宣布 Gemma 3n 已经上线! 🎉
🔊 多模态(文本/音频/图像/视频)理解
🤯 仅需 2GB 的 RAM 即可运行
🏆 首个在 10B 以下的模型,@lmarena_ai 得分超过 1300
现在可以在 @huggingface、@kaggle、llama.cpp 等平台上获取

人们*感受到*还有多少工作要做吗?真是太惊人了。
1.03M
热门
排行
收藏