一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

中间那个小黑盒子是机器学习代码。我记得读过谷歌2015年的《机器学习中的隐性技术债务》论文，想着机器学习应用中实际的机器学习有多少。绝大多数是基础设施、数据管理和操作复杂性。随着人工智能的兴起，似乎大型语言模型会取代这些盒子。承诺是简单：放入一个LLM，看看它如何处理从客户服务到代码生成的一切。不再需要复杂的管道或脆弱的集成。但在构建内部应用时，我们观察到了与人工智能类似的动态。代理需要大量上下文，就像人类一样：CRM是如何结构化的，我们在每个字段中输入什么——但输入是昂贵的，饥饿的人工智能模型。降低成本意味着编写确定性软件来替代人工智能的推理。例如，自动化电子邮件管理意味着编写工具来创建Asana任务并更新CRM。随着工具数量超过十个或十五个，工具调用不再有效。是时候启动一个经典的机器学习模型来选择工具了。然后是观察系统的可观察性，评估其性能，并路由到正确的模型。此外，还有一整类软件确保人工智能按预期工作。护栏防止不当响应。速率限制防止系统失控时成本失控。信息检索（RAG - 检索增强生成）对任何生产系统都是至关重要的。在我的电子邮件应用中，我使用LanceDB向量数据库查找来自特定发件人的所有电子邮件并匹配他们的语气。还有其他关于图形RAG和专用向量数据库的知识管理技术。最近，记忆变得更加重要。人工智能工具的命令行界面将对话历史保存为markdown文件。当我发布图表时，我希望右下角有Theory Ventures的标题，特定的字体、颜色和样式。这些现在都保存在一系列级联目录中的.gemini或.claude文件中。大型语言模型的原始简单性已被企业级生产复杂性所取代。这与上一代机器学习系统并不完全相同，但它遵循了一个明确的平行关系。看似简单的“人工智能魔法盒”实际上是一座冰山，大部分工程工作隐藏在表面之下。

3.68K