知识库 Agent 为什么不一定非要用向量数据库？

因为很多问答本质上是在找明确字段、配置项和文件位置。对这类任务，grep、find、cat 这类文件检索往往更直接，也更容易解释为什么答成这样。

文件系统检索比 embedding 检索更好吗？

不一定绝对更好。它更适合结构清晰、关键词明确、资料边界稳定的知识库；如果问题高度语义化、表达特别发散，embedding 仍然有优势。

为什么说这套方案更容易调试？

因为每一步都看得见。你能知道 agent 查了哪个目录、跑了什么命令、读了哪个文件，而不是只看到一个分数很高但说不清为什么命中的 chunk。

不用向量库能省多少钱？

要看流量和数据规模，但 Vercel 给出的案例里，单次调用成本从大约 1 美元降到 0.25 美元。最关键的不只是便宜，而是省掉了 embedding、切片和检索调参带来的维护成本。

这套思路适合拿来做企业内部文档问答吗？

很适合先试。尤其是文档本来就按目录管理、版本明确、开发者习惯命令行的团队，先用文件系统方案跑通，通常比一上来堆复杂 RAG 基础设施更稳。

知识库 Agent 可能根本不需要向量库，Vercel 这刀捅得有点狠

很多知识库 Agent 其实不一定需要 embedding 和向量数据库。 如果你的问题更像"配置写在哪""这个价格表在哪一页""权限规则藏在哪个目录"，那文件系统加 grep、find、cat 这种老派办法，可能反而更稳、更便宜，也更好排错。

这事听起来有点反常识。过去一年，大家一提知识库问答，默认流程几乎都是：切 chunk、做 embedding、丢进向量库、调召回、再祈祷别抽风。结果 Vercel 最近直接把桌子一掀：别上来就整这套，先让 Agent 去读文件。

他们到底干了什么？

Vercel 开源了一套 Knowledge Agent 模板，核心思路非常直接：不用向量库，直接把知识源同步成文件，然后让 Agent 在沙箱里跑 bash 命令检索。

翻成人话就是，Agent 不再靠"语义相似度"猜哪段文本最像答案，而是像一个有点勤快的工程师一样：

先找目录
再搜关键词
然后打开对应文件
最后基于读到的内容回答

这个思路听上去不性感，但它有个巨大优点：你知道它到底是怎么找到答案的。

为什么这套东西会让人眼前一亮？

因为太多 RAG 项目，死得不是因为模型不够强，而是检索链路太黑箱了。

你问一个很具体的问题，比如"企业版价格的附加席位怎么收费"。系统答错了。接着你就得开始考古：

是 chunk 切坏了？
是 embedding 没理解这句话？
是相似度阈值太低？
还是召回了正确片段，但排序没顶上来？

这种排错体验，真的很像在雾里找遥控器。

而文件系统流派就没那么玄学。它如果答错，你大概率能直接看到：哦，它搜了 pricing，结果打开了旧版文档，或者它关键词下错了，漏掉了另一个目录。这个问题一下就具体了。

不是"反向量库"，而是别默认它是标准答案

我觉得 Vercel 这次最有价值的地方，不是证明向量库没用，而是提醒大家：别把 embedding 管线当成知识库 Agent 的唯一正确姿势。

很多内部知识库，本来就是强结构化的：

文档有目录层级
文件名可读
配置项有明确关键词
内容经常是 markdown、代码、手册、FAQ

这种场景，本来就很适合文件检索。你硬塞进向量库，最后得到的可能不是"更智能"，而是"更复杂"。

更扎心一点说，很多团队做知识库系统，花的时间根本不在回答问题，而是在维护检索基础设施本身。模型倒成了最不折腾的那一环。

这套思路为什么还更便宜？

Vercel 给的案例里，某个销售通话总结 Agent 的单次成本从大约 1 美元降到了 0.25 美元。

原因也不神秘：

少了一层 embedding 生成和存储
少了一套向量索引维护
少了大量检索调参和重复试错
Agent 直接对文件操作，路径更短

当然，不是所有场景都能这样降本。但对很多中小型知识库来说，这个方向确实很香：你不是在省几分钱，而是在省掉一整个会持续啃工程时间的系统。

它适合什么场景？

如果你手里的数据更接近下面这些，真的可以优先试文件系统方案：

产品文档中心
企业内部 SOP
帮助中心和 FAQ
代码仓库、SDK 文档、接口说明
版本清晰的 markdown/文本资料

尤其是开发者向产品，命令行检索本来就是母语。Agent 能直接用大家熟悉的方式找资料，整体心智成本会低很多。

顺带一提，这也挺像一个朴素但经常被忽略的原则：能先用简单系统解决的问题，就别急着上复杂系统。

如果你最近也在搭知识库或者企业问答工具，真可以先把这套思路过一遍。与其一上来就配齐向量库、重排器、切片策略，不如先问一句：我这个问题，文件系统能不能已经解？你可能还想看：更多 AI/开发文章。

但它也不是银弹

该说的也得说，这玩意儿不是万能解法。

如果你的数据特别松散，用户提问方式又很飘，靠关键词根本对不上；或者你需要跨大量异构内容做语义联想，那 embedding 检索还是有意义。

所以更靠谱的结论不是"以后别用向量库"，而是：

先判断你的知识库问题到底更像搜索问题，还是更像语义理解问题。

前者，文件系统和 bash 可能就够猛。后者，再上向量库也不迟。

我更喜欢这件事的哪一点？

不是省钱，也不是复古。

而是它把 Agent 这件事从"神秘魔法"往"可维护系统"拉回去了一点。你能看见它怎么查、怎么读、怎么答，工程上就更敢信它，也更容易把锅甩到正确的位置。

这点很重要。因为真正能在线上活下来的 Agent，最后拼的往往不是 demo 多惊艳，而是出错时你能不能十分钟内知道它错在哪。

Vercel 这次给的不是唯一答案，但确实像一巴掌扇醒了不少人：

知识库 Agent 不一定要先从向量库开始。很多时候，先把文件夹和命令行用明白，才是那条更短的路。