关于ZAKER 合作
钛媒体 15分钟前

Agentic AI 时代,向量数据库成“必选项”

从 ChatGPT 问世,到 Agentic AI(代理式 AI)逐步 " 照进现实 ",新一轮 AI 技术快速发展的背后,对底层基础设施建设也提出了新的要求。

当 OpenAI 的 GPT-4 开始展现出自主任务分解能力,当 AutoGPT、Devin 等智能体能够独立完成复杂工作流程,一个根本性问题摆在整个 AI 产业面前:这些有记忆、会反思、能行动的 Agent,究竟该把它们的 " 海马体 " 存放在哪里?传统数据库的磁盘 I/O、精确匹配与静态架构,在高频读写、语义模糊、成本敏感的 Agentic AI 时代显得格格不入。向量数据库,这个曾被视为 AI" 锦上添花 " 的技术,正迅速从幕后走向台前,成为支撑下一代智能体系统的关键基础设施。

Agentic AI 对数据库提出了新要求

生成式 AI 以内容创造为核心,Agentic AI 以自主决策交互为特征,二者的快速演进推动向量数据库从基础存储检索工具向 AI 能力基座升级,催生出在数据处理、性能表现、功能适配等多维度的全新需求,据 Gartner 预测,2025 年 Agentic AI 市场规模将突破千亿美元,年复合增长率超 65%。这一爆发式增长背后,是向量数据库技术的持续突破。

2023 年初,当 ChatGPT 掀起第一波大模型热潮时,市场对向量数据库的认知还停留在外挂知识库层面。并且此后很长一段时间里,AI 的核心价值体现在内容生成——无论是撰写报告还是生成代码,本质上都是对用户指令的被动响应。

彼时,企业将向量数据库视为解决大模型幻觉、扩展私有知识的 " 补丁工具 ",典型的应用场景是 RAG(检索增强生成)——将企业文档向量化后存入数据库,用户提问时检索相关片段喂给 LLM 生成答案。这是一个被动、静态、低频的调用模式。

但 Agentic AI 的出现彻底改变了这一逻辑,其核心特征是自主目标驱动:能够理解复杂需求、拆分任务流程、调用外部工具、实时调整策略,最终完成端到端的复杂任务。

据 Gartner 预测,到 2028 年,支持生成式 AI 的数据库支出将达 2180 亿美元,占市场 74%。但 MIT 研究显示,超 95% 的企业 AI 项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。

"Agentic AI 的爆发,正在颠覆数据库行业的底层逻辑。"Zilliz 解决方案总监沈亮直言," 当 AI 从‘被动响应工具’进化为‘主动决策主体’,传统数据库的短板被无限放大,而向量数据库正成为这场变革中不可或缺的核心基础设施。" 作为全球首个向量数据库企业、开源向量数据库 Milvus 的创造者,Zilliz 见证并推动了向量数据库从技术概念走向商业规模的全过程。

Zilliz 解决方案总监沈亮

" 在 AI 从被动到主动转变的过程中,也将数据库推向了 AI 决策的核心一环。" 沈亮表示。

Agentic AI 所需要具备的自主规划、工具调用、持续学习、多轮记忆的核心特征,对底层数据库提出了四类刚性需求:

首先是对读写性能的要求进一步提升。传统 RAG 场景以读为主,知识库更新周期可能是天甚至周。但 Agent 在单次任务中就可能产生数十次读写操作:检索经验记忆(读)、写入行动日志(写)、更新用户画像(写)、查询工具链(读)。沈亮指出:"Agent 调用记忆模块的频次、数据更新速度,不光要读,很多时候还要去写,这对数据库的读写性能要求比传统 RAG 高很多。" 所以长期以来,Milvus 针对高性能读写做了大量优化。

第二是,与传统数据库的 " 千人一面 "(数据信息是固定的,每次查询得到的信息也是固定的)相比,Agent 为每个用户生成的记忆是 " 千人千面 ":行为轨迹、偏好向量、反馈记录都需要独立存储。" 千万用户乘以个性化数据,向量数据动辄就是百亿量级。业界能比较好处理这么大体量数据的向量数据库非常少。" 沈亮测算道," 而 Milvus 以及其商业版的 Zilliz Cloud 是为数不多能解决这个问题的产品。"

第三是,成本与性能之间要实现平衡。Agent 应用商业化早期 ROI 低,企业对价格极度敏感,如果将全部向量数据全部采用内存存储,带来高昂的成本,令企业无法接受。这就要求数据库具备智能化的数据生命周期管理——热数据高性能访问,冷数据低成本存档。针对这一背景 Milvus 推出了内存 - 磁盘 - 对象存储的多层存储方案来解决这个问题。

第四是,从单一模态到多模态融合处理能力的提升。对于 Agentic AI 而言,多模态交互已经是必选项,Agent 需同时理解文本、图像、地理位置、用户行为等多种信号。这就对数据库提出了能够同时处理语音向量、图像向量,并实现跨模态的关联检索的要求。传统数据库的单模态精确匹配,无法支撑多向量列联合召回的复杂场景。而 Milvus 自 2.4 版本开始,就已经开始了对多向量列 + 各种标量数据的探索,迄今为止,已经积累了稠密向量、稀疏向量、二值型向量等向量类型数据(可广泛表示各种多模态数据),以及地理位置、标签、时间日期等标量类型数据的支持。

落到具体场景中,以电商智能客服为例,传统 AI 客服仅能根据关键词匹配预设答案,而 Agentic AI 客服则能自主查询用户历史订单、当前商品库存、物流信息,甚至结合促销规则为用户制定个性化购买方案,甚至还需要具备一些图片识别、语音 / 语义识别的能力。这个过程中,AI 需要在毫秒级内完成海量非结构化数据的检索与关联,传统数据库根本无法承载。

向量数据库是 " 决策中枢 " 的底层逻辑

在应对这些挑战的过程中,向量数据库正转变为企业应用 Agentic AI 的必选项。

向量数据库的核心价值不在于存储,而在于高效检索 " 语义相似性 "。众所周知,传统数据库(如 MySQL、PostgreSQL)主要面向结构化数据需求,擅长处理结构化数据的精确匹配,但却无法满足生成式 AI 对海量非结构化数据的存储、管理以及语义检索需求。

而向量数据库处理的是非结构化或半结构化数据(文本、图像、音频)经过深度学习模型编码后生成的高维向量(通常数百到数千维)。其核心查询是:找出和这个向量最相似的 Top-K 个向量。

与此同时,作为 LLM 的记忆体,向量数据库以极具性价比的形式为其提供存储功能,在减少大模型开发成本的同时,也能极大提高 LLM 的性能。另外,对于那些对数据隐私有需求,不希望将本地数据上传大模型的企业来说,向量数据库也是它们存储和管理企业知识的不二选择。

对此,沈亮表示:"Agent 需要记录短期历史、长期经验、工具调用效果,这些数据与传统知识库差别非常大。向量数据库从被动工具变成了主动、灵活、高频访问的核心组件。"

具体而言,向量数据库为 Agentic AI 提供四大不可替代的价值:

价值一,构建可扩展的认知记忆。 通过向量化存储,Agent 的每次交互、每个决策都被编码为高维空间中的点。Milvus 的分布式架构支持百亿级向量存储,配合冷热分层,让 " 记忆 " 既有容量又有速度。这相当于给 Agent 构建了一个可无限扩展的 " 数字海马体 "。

价值二,实现低延迟的经验检索。当 Agent 遇到新问题,需在毫秒级从海量记忆中找到最相关经验。Zilliz Cloud 的 AutoIndex 技术使查询性能提升 3-5 倍,某电商客户图搜场景实现

价值三,支撑多 Agent 的集体协作。复杂任务需多 Agent 协同,向量数据库作为中央知识枢纽,存储各 Agent 的中间结果与共识知识。

价值四,降低 AI 落地的信任门槛。通过 BYOC 方案,企业可将数据保存在自有 VPC 中,满足 GDPR、HIPAA 等合规要求。这是金融、医疗、自动驾驶等领域采用 Agentic AI 的前提。

沈亮指出 Agentic AI 与传统 RAG 不同,对向量数据库底层数据库特性有要求。" 性能上,读写频次和数据更新速度要求高,公司采用读写分离架构,避免读写相互影响,而部分友商产品存在读写相互折损问题。"

Zilliz 一直把自己定位在 AI Infra 层,将向量数据库作为连接大模型与垂直场景的关键齿轮。而且与其他数据库服务商专注于做闭源产品不同的是,Zilliz 选择了开源 Milvus 与闭源 Zilliz Cloud" 双管齐下 " 的商业模式,而且开源产品 Milvus 作为起家产品,其能力已经在多个行业应用中得到了认可。

比如,在 HR 领域,智联招聘与 Milvus 合作,采用向量召回技术提升招聘匹配效率。通过双塔模型结构处理 JD 和 CV 文本信息,映射为低维向量,利用对比学习优化匹配精度。使用 Milvus 进行向量数据库管理,通过体感评估和量化指标评估模型表现,解决人力线索评估的难题;在传媒领域,搜狐新闻利用 Milvus 分布式向量检索引擎,提升了个性化新闻推荐系统的性能,包括向量检索速度提升 10 倍,新闻分类准确率提高至 95%,并减少了内存占用。这使得搜狐新闻能够更快响应用户需求,降低成本,并提升用户体验。

沈亮介绍道,一方面,Zilliz 通过开源的 Milvus 向量数据库搭建起了开源开放的数据库社区,吸纳更多的用户和企业,让他们对向量数据库有了更为深刻的了解,通过开源的产品,Zilliz 也可以从用户那里及时获得新需求,从而 " 反哺 " 商业化产品 Zilliz Cloud,让更多人了解 Zilliz。

另一方面,当使用 Milvus 产品的用户在业务上有进一步需求的时候,因为对 Zilliz 的能力已经有了初步的了解,在寻求进一步服务的过程中,选择 Zilliz 商业化产品—— Zilliz Cloud 的可能性也会更大,沈亮指出,"Milvus 与 Zilliz Cloud 完全接口兼容,企业可以根据自身需求灵活选择,很多客户先通过开源版验证技术可行性,再平滑迁移至商业版,迁移成本几乎为零,分钟级即可完成切换。"

当开源用户规模达到临界点,运维复杂度、性能瓶颈、成本压力会促使它们转向商业版。" 我们有相当多的商业化用户是从开源转来的," 沈亮举例," 某头部电商早期用 Milvus 搭建向量检索平台,支撑图搜、推荐、风控等场景。但到了双十一,他们意识到自建方案在稳定性、性能调优上存在瓶颈,最终整个集群切换到 Zilliz Cloud。"

与云协同,铺设通往通用智能的 " 记忆高速路 "

向量数据库的性能发挥高度依赖底层基础设施的弹性与扩展性,而云原生架构恰好提供了这样的能力。有报告显示,2024 年全球云 DBMS 收入占比已达 64%(766 亿美元),贡献了 89% 的市场增量,包含亚马逊云科技等在内的头部服务商垄断了 76% 的云数据库市场份额。这一数据表明,云已成为数据库的主流部署环境。

正是看到了云原生的巨大优势,Zilliz 自 2021 年起便与亚马逊云科技展开合作,目前已成为亚马逊云科技最高等级的第三方合作伙伴,双方的合作从技术适配、产品集成延伸至市场推广、客户服务等多个层面,形成了深度绑定的战略关系。" 与亚马逊云科技的合作不是简单的产品集成,而是从底层技术到上层生态的全方位协同。" 沈亮如是说。

在资源配置方面,基于 Amazon Elastic Compute Cloud ( Amazon EC2 ) 丰富的实例类型,Zilliz Cloud 提供了包括性能型、容量型、存储扩展型等多套深度优化的解决方案,满足用户不同的负载需求。

在弹性架构方面,Zilliz 基于 Amazon Elastic Kubernetes Service ( EKS ) 的容器化自动扩缩容能力,可动态应对流量高峰,确保用户业务量激增时 AI 应用的稳定高效运行。

在成本优化方面,Zilliz Cloud 还适配了支持 Amazon Graviton 处理器的实例,可将成本优化提升 20% 以上,并显著提升性能。

具体来看,选择 Zilliz Cloud 向量数据库解决方案构建各种 AI 应用的客户,也利用亚马逊云科技在模型服务层的优势,通过灵活的 API 接口,在 Amazon Bedrock 上调用领先的大语言模型和嵌入模型,做快速选择、切换和调用,并进一步大幅简化数据处理流程,释放数据深层价值。

此外,Zilliz 应用生成式 AI 助手 Amazon Q 帮助技术团队更快熟悉亚马逊云科技的服务,简化信息访问、加强信息检索与优化配置,相比直接阅读产品文档,可为技术人员节省 50% 以上的检索时间。

商业层面,亚马逊云科技 Marketplace 为 Zilliz 导入大量用户,更重要的是,这些用户中相当一部分是国内 AI 出海企业。" 他们在美国、日本、新加坡做创新应用,最关心应用开发周期,试错成本要低。" 沈亮分析," 我们的向量数据库 + 亚马逊云科技的 AI 生态,让他们创新周期大大缩短。"

Zilliz 与亚马逊云科技的合作不仅是 " 单方面的胜利 ",而是双方相互成就。除了亚马逊云科技为 Zilliz 的向量数据库提供了稳定的云环境、模型服务层优势,以及出海的支撑之外,Zilliz Cloud 的高性能向量搜索能力也为亚马逊云科技企业客户带来了显著的商业影响。凭借在数十亿向量中进行低于 10 毫秒延迟的搜索以及严格的合规性,组织可以以前所未有的规模实施 AI 应用。" 很多用户最初只用 Milvus 开源版,我们引导他们使用亚马逊云科技的服务后,他们会更多使用 SageMaker、Bedrock 等 AI 产品,为亚马逊云科技带来新用户。" 沈亮如是说。这种共生关系,使双方从 " 供应商 - 客户 " 升级为 " 生态伙伴 "。

" 通过选择在亚马逊云科技上使用 Zilliz Cloud,组织可以自信地扩展其向量搜索操作,并专注于创新,而非基础设施管理。" 沈亮指出。例如,美国顶级的法律 AI SaaS 公司 Filevine 使用 Zilliz Cloud 使海量法律文档可快速搜索,将研究时间从数小时缩短至数分钟。这一改进得益于 Zilliz Cloud 对其自研向量数据库内核 Cardinal 的 10 倍的性能提升(相较开源 Milvus)以及自动索引 AutoIndex 优化等功能。

当前,对于企业而言,选择合适的向量数据库与云平台,构建 AI 原生的数据架构,已成为把握 Agentic AI 机遇的关键。回看 Ziiliz 的来时之路,在数据库的 " 战场 " 上,Zilliz 抓住了 AI 带来的机遇,实现了 " 长期主义者 " 的突围。Zilliz 用 7 年时间证明,在 AI 时代,数据库不再是幕后存储,而是智能体认知的 " 第一性原理 "。

从十亿向量到千亿向量,从单模态到万模态,从静态知识到动态认知,向量数据库的演进,本质上是在为 AI 铺设一条条通往通用智能的 " 记忆高速路 "。而 Zilliz 已成为这条公路上最坚定的筑路者。

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容