对话Zilliz创始人星爵:我们没有对手,接下来的大事是 Agentic RAG

作者Jessica
邮箱JessicaZhang@pingwest.com

2025年春,AI行业正步入一个新的阶段。

Meta发布多模态模型Llama 4,OpenAI连续推出GPT-4.1、o3及o4-mini、计划发布首个“开放”语言模型,并被曝正在打造一款“AI版Twitter”;与此同时,被誉为“AI界USB-C”的新兴标准MCP悄然走红——它让AI Agent不只局限于回答问题,而是具备主动感知、任务规划与工具调度的能力。系统范式的变革,比模型性能的迭代更引发从业者关注。

随着“小模型+本地部署”“多模态+实时处理”成为新趋势,AI底层基础设施也被重新定义。尤其是非结构化数据的处理、语义检索的效率,成为决定Agent能力边界的关键。而向量数据库,正在成为这类系统的“语义记忆中枢”。

在这一领域,Zilliz 是少数几个走在前面的玩家。去年9月,Forrester发布首份向量数据库Wave报告,Zilliz被评为“全球领导者”,领先于DataStax、Microsoft、Amazon和Oracle等老牌厂商。同年10月,其开源项目Milvus在GitHub上的Star数突破三万,成为全球最受欢迎的向量数据库之一。

近期,我们与Zilliz创始人兼CEO星爵进行了一场对话。聊了聊这家公司如何一路从“小众赛道开拓者”成长为当下AI应用基础设施的重要一环。

对话实录如下:

“从2019开辟这个赛道迄今,zilliz没有对手”

硅星人:先用一句话,向那些还不熟悉向量数据库的人解释一下它吧。

星爵:一句话太难了,我用三句话试试。

这是面向非结构化数据、和大模型时代专用的语义检索数据库;它用向量相似度检索,让机器学会了“类似”的概念;是AI时代搜索的正确打开方式。

硅星人:从 ChatGPT 带火向量数据库,至今已有两年多了,行业都经历了哪些关键变化?

星爵:“向量数据库”从小众概念变为行业刚需。认可你的伙伴变多了,但赛道中的对手也多了。

硅星人:你如何定义刚需?

星爵:我只有体感,说不上定义行业。

从体感来说,2022年上半年,大家都在问我什么是向量数据库,以及和Oracle有什么区别、和PostgreSQL有什么区别。

2023年开始没人再问我向量数据库是什么,而是开始追问,你和Elasticsearch、和pgvector、Chroma相比,到底有什么优势。

可以作为刚需佐证的,是第三方数据,MarketsandMarkerts 预测:2023年-2028年,全球向量数据库市场规模预计将从15亿美元增长到43亿美元,预计年复合增长率为23.3%。

硅星人:这个数据比我想的要低。

星爵:我也同意,至少Zilliz的实际增速远远高于第三方的市场预测。而且我们内部对未来的增长预期也不止于此。2024年,我们的年度经常性收入实现了三倍增长。

硅星人:支撑你这么乐观预期的源头来自哪里?

星爵一方面是产品真的成熟了,另一方面是外部的正向反馈。

产品上,我们提供的既有开源的Milvus,也有商业化的Zilliz Cloud。

其中Milvus2019年开源,到2024年下半年,我们的GitHub星标数已经突破 3 万,累计下载量超过一亿次,全球企业用已有超过 1 万家采用。Zilliz Cloud则通过AWS、谷歌云、微软Azure、阿里云和腾讯云,已经可以服务全球20多个国家和地区。

硅星人:这是一个高速线性扩张的过程?

星爵我觉得目前阶段应该是指数级扩张。

硅星人:扩张的动力来自哪里?

星爵:千行百业的需求。

从行业来看,AI初创企业、互联网、电商、自动驾驶、金融、法律和教育多个领域,我们全都积累了成熟的方案。

从产品的功能和商业策略设计上,根据这些不同行业的特性,我们推出了多租户和多种企业级安全合规,还有免费额度和弹性计费模式来降低试用门槛。此外,设计上,对一些有特殊合规需求的客户,我们还发布了BYOC方案。

总结来说,就是从给客户提供一个工具,变成了实际解决了客户的问题。一个能帮你解决实际问题的产品,没有人会拒绝。

硅星人:面对这么多行业做的这么深,那成本会变得更高吗?

星爵不会,因为Zilliz的全部收入基本都来自云产品,这也是我们一开始就定下的基本原则。

你可以理解为行业有特性,但这些特性——比如合规、高并发、多租等等,都是可以通过工具组合去解决的。我们的know how是帮助客户找到最合适的工具,而不是换一个客户,造一次轮子。

当然,这并不是说事无巨细的服务错了,但既然都做基础软件了,那你的看家本领,就是总结共性需求。

硅星人:要是客户给的实在太多了呢?

星爵做企业就是不断在天平的两端做抉择,但很多人没有判断天平砝码真实重量的能力或者勇气。

比如,一个私有化的单子三千万。天平两端,并不是赚这三千万和不赚这三千万,而是赚眼前的3000万,和破坏长期商业模式,减少通往未来赚30亿、300亿,甚至3000亿的可能。想清楚这些,你就知道,有些钱,即使送到门口,你也是不能赚的。

硅星人:所以你确认Zilliz是那个未来能赚300亿、3000亿的玩家吗?

星爵六年前,我们开源Milvus创造了向量数据库这个赛道,到现在,我依然觉得我们没有对手。不止我们自己这么认为,开发者口碑、外界最权威的三方也这么认为。

比如,Milvus在github三万星,一直都是全球最大、且最具有影响力的开源向量数据库产品。去年三季度,Forrester 还在其首份向量数据库报告(2024年Q3)中将 Zilliz 评为领导者,在向量维度支持、向量索引、性能、可扩展性等多项关键指标上获得了最高分。

硅星人:刚刚你提到,对手变多了,有Elasticsearch 、 pgvector还有Chroma。

星爵:我们之间的关系,可以理解为错位竞争的“对手”。或者说,他们把zilliz当成了对手。

这两年,zilliz的重点投入的方向之一,就是如何搞定大规模数据和高并发需求,为此做了很多分布式扩展与索引优化:比如通过横向扩展集群来提升容量和容错,通过高效索引算法加速等提高检索吞吐。

但Elasticsearch 和pgvector还是传统数据库和搜索引擎增加了向量检索插件,Chroma则是轻量级嵌入向量存储库。他们的门槛更低,甚至这两年的增长也很快,但他们大多依托单机扩容方案,受限于单节点性能并存在单点故障风险,缺乏持久化和横向扩展能力,相比分布式架构可靠性欠佳。

通俗点说,非结构化数据,占了数据总量的80%。在这个背景下,用传统结构化数据库时代的产品修修补补,就像是基于燃油车的架构,怎么改也不是新能源汽车。

硅星人:但对手的使用成本更低。

星爵:如果你说的是生产级场景,那这是错觉。

针对向量检索,我们在同等规模下,一定比非原生的向量数据库方案更高效。

比如pgvector是在 PostgreSQL 之上通过插件方式支持向量检索,上手难度的确比较低,但是它只适合小规模向量存储和与结构化数据的简单结合,在大规模和性能方面远不及Milvus。

根据实际测试,Milvus 在处理大规模向量时的性能/成本效率比pgvector高出两个数量级。Milvus 在底层针对向量算子做了深度优化,并采用近似算法和分布式架构,而pgvector还是传统数据库内核,只能采用精确搜索或简单索引,算法效率不高。

此外,pgvector受限于 PostgreSQL 单机扩展能力,当数据量和并发升高时,性能会急剧下降并且难以水平扩展。Milvus 就可以轻松横向扩容,多节点分担查询。

从功能完善度看,Milvus 支持丰富的向量索引类型、灵活的向量距离度量,以及对时间旅行、分区等高级特性的支持,这些都是pgvector尚不具备或不成熟的。

简言之,pgvector是传统数据库的“附加组件”,而 Milvus 是为向量检索“量身打造”的完整解决方案。

硅星人:那你怎么看Pinecone ,他们也是你说的云原生向量数据库。

星爵:Pinecone 是闭源的云托管向量数据库,以易用和全托管著称。但和 Zilliz 相比,其部署灵活性和架构扩展性存在差异。

Pinecone 目前主要提供云上服务,没有开源自托管版本,这对数据敏感或需本地部署的客户并不友好。而 Zilliz 既有开源 Milvus 可自建,也有云服务,客户选择更多元。

另外,在架构上 Pinecone 采取“纵向扩展”为主的策略,即通过单节点高性能实例(称为pod)来提升性能。这种模式下,每个pod仍然跑在单机上,受限于单机的CPU和内存上限。相较而言,Milvus 的横向扩展架构可利用多机协同,避免了单节点瓶颈,并天然具备故障切换能力。

举例来说,如果需要存储万亿级向量,Pinecone 可能需要一台超大型内存实例且难以保障不宕机,而 Milvus 可以分布到数十台普通服务器,任一台出问题不影响整体。这种架构优势在超大规模应用下尤为明显。

Qdrant也一样,在包含1亿条 768 维向量的数据集中,Zilliz Cloud 的 QPS 达到 Qdrant 的 7 倍,P99 延迟仅为 Qdrant 的 1/12。 Qdrant 主要作为单机服务存在,后来他们通过sharding技术支持集群,但其分布式架构相对Milvus仍不够弹性,运维难度不小。

硅星人:换一种说法的遥遥领先?

星爵:准确说是各有所长吧。

比如,不少个人开发者的向量数据库启蒙产品,除了Milvus可能就是ES、pgvector。其他的,像Qdrant 更适合追求低成本基础设施维护的开发人员,适用于对过滤查询有需求但不追求极端性能的场景。Pinecone更像封装好的云工具,适合快速验证但伸缩性受限,不适合超大规模的复杂企业场景。

Zilliz 的优势在于开放灵活、可线性扩展,非常适合企业长期演进和定制需求,还有对性能指标有严格要求的应用系统。

大模型时代,RAG始终是刚需,但应用范式与对向量数据库的需求一直在变化

硅星人:DeepSeek火起来,对Zilliz有什么影响吗?

星爵:模型进步降低了AI应用的部署门槛,扩大了向量数据库的潜在市场。

其次,这些模型往往需要更高效的知识检索机制来提升其能力,这正是向量数据库的价值所在。开源模型的兴起还推动了更多本地部署需求,增加了对高性能向量数据库的需求。

硅星人:一边是推理大模型爆火,一边是落地中,从”大模型为王”逐渐向”小模型+本地部署”过渡。这对向量数据库行业意味着什么?

星爵:小模型在知识广度上不如超大模型,当AI应用从依赖超大模型API转为使用本地小模型,企业就需要通过检索自有数据来补足,向量数据库也就从“可选项”变成了“必选项”。

硅星人:所以,在你看来,企业场景中,RAG始终是刚需吗?

星爵:是的。但这个刚需在不同阶段的表现形式不同。

硅星人:这个怎么说?

星爵:我认为传统RAG始终有自己的局限性。因为传统RAG只能基于提问,做一次语义检索。但我们一句话背后,往往会对应好几层潜在逻辑。

你想,多少男的因为女朋友让自己洗碗,自己就真的只洗了个碗,没有刷锅、打扫厨房、检查油烟机而挨骂?

人都不一定能一秒get你的话中话,AI检索一次语义检索,就能达到效果就就更不可能了。

硅星人:那要怎么办?

星爵:今年我比较看好深度搜索(Deep Search)和深度研究(Deep Research)这两个新的RAG范式,笼统来说就是Agentic RAG。

他们的共性是由开发者显式调用向量数据库变成大模型自发地发出检索请求,并由大模型决定检索的范围、次数以及结果判定。过程中,向量数据库将成为AI Agent的记忆中枢,支持其执行复杂任务。Agent在运行中生成的信息可实时向量化存储,便于决策时快速检索相关记忆。

面对复杂问题时,系统会先对问题进行拆解,然后检索概览信息,再基于初步理解再发起更精确的二次、三次检索,甚至进行多路径并行检索,最终综合各方结果形成更全面的回答,特别适合需要深入分析的专业领域应用。

例如,网络安全Agent可在日志向量库中搜索异常模式,科研Agent可检索文献Embedding库。

硅星人:这对向量数据库有什么要求?

星爵:向量数据库需提供标准化API和结果摘要,支持Agent动态优化查询策略。

此外,向量数据库要与工作流引擎融合,成为数据处理自动化和语义智能的新模式。Zilliz正开发集成方案,如Serverless函数触发器,连接云原生工作流。

硅星人:除了做的更深,RAG与Agent还有什么发展趋势?

星爵:多模态实时检索和动态数据更新。

当前的数据多是静态文本,而未来需要支持视频帧、图像、音频、传感器数据流等实时处理,Agent需要在向量空间中检索跨模态关联,进行综合分析。这方面的技术挑战主要在于实现低延迟的混合检索与高效的数据版本管理。Zilliz正在优化多模态向量支持,以应对这一趋势。

硅星人:除此之外,向量数据库领域还有哪些技术挑战是你们正在积极解决的?

星爵:当前向量数据库领域面临的关键技术挑战主要包括:海量数据的可扩展性、检索性能与成本平衡、以及满足企业级可靠性的能力。

挑战一:千亿级向量的存储与查询可扩展性。随着应用积累的数据规模爆炸式增长,向量库需要存储千亿甚至万亿向量并保持可用的查询速度。这对架构提出巨大挑战。Zilliz 的解决方案是采用分布式可横向扩展架构。Milvus 从一开始就设计为无中心节点的分布式系统,可通过增加节点线性扩展存储和计算能力。与只依赖单机扩容的方案相比,Milvus 的集群架构有效避免了单点瓶颈和故障风险。即使某一节点发生故障,只影响全局数据的1/256(假设256节点集群),通过副本机制可迅速恢复。这种架构使 Milvus 能够轻松处理千亿级的数据集并提供高可用性。此外,Milvus 还支持存储计算分离和分片机制,将向量分布存储在不同节点并并行检索,从架构上保证了在数据规模增长时查询性能线性可伸缩。

挑战二:检索性能与硬件加速。向量相似度计算本质上是高维算术运算,如何在毫秒级延迟下完成 Top-K 查询是核心难题之一。为此 Zilliz 高度重视异构计算加速。Milvus 内部针对 Intel/AMD CPU、ARM 处理器和 NVIDIA GPU 等不同硬件分别优化了执行引擎算法。例如,对 CPU 利用SIMD指令并行计算,对GPU批量处理向量计算,充分发挥每种硬件的优势。这使 Milvus 能够在纯CPU环境下达到极高吞吐,在有GPU的环境下进一步提升密集计算性能。我们自研的 Cardinal 引擎,通过缓存优化和底层代码级别调整,把常用Top-K查询的速度提升了一个数量级,同时保持精度在95%以上。综合这些手段,Zilliz 在权衡性能与成本上取得突破。例如,据内部测试,Milvus 在相同规模数据上的检索性能/成本比比pgvector、OpenSearch等通用数据库方案高出数十倍以上。

挑战三:企业级可靠性与安全。要成为“数据库”,光有检索性能还不够,还必须提供如数据持久化、容灾备份、权限控制等企业必需特性。Zilliz 针对这些痛点逐一攻克。Milvus 采用事务日志+快照机制保障数据持久一致,在系统崩溃或重启后能够恢复到最近一次快照状态,实现类似ACID中的原子性和持久性保证。在高可用方面,通过多副本和分布式一致性 ,确保服务7×24不间断。安全性上,最新版本 Milvus 引入了Role-Based Access Control (RBAC),支持多租户和用户权限管理。这使企业可以在同一集群内安全隔离不同应用的数据。此外,Zilliz Cloud 还通过虚拟私有云、加密存储等手段,满足严苛的安全合规要求。可以说,Zilliz 正将传统数据库数十年成熟的“幕后功能”逐步融入向量数据库,使其真正达到企业生产可用级别。

向量数据库不会取代谁,但未来的千行百业都会需要它

硅星人:你认为向量数据库会成为”新一代数据基础设施”吗?未来它会逐步取代部分传统数据库,还是仅作为 AI 时代的一种补充?

星爵:准确说是互补关系。

不同类型数据库有各自擅长领域,很难相互完全取代,就像我们不会用图数据库去记账,也不会用关系数据库做图像搜索一样。传统关系型数据库在事务处理、强一致性、结构化查询上仍无可替代,未来企业依然需要它们来管理结构化业务数据。而向量数据库更像是在原有数据架构旁新增了一条“语义通道”,专门处理非结构化数据的相似性和关联性查询。未来企业的IT体系中,传统数据库与向量数据库将协同共存:前者管业务流水,后者管内容语义,两者通过外键或者标识互相引用,共同为AI时代的应用提供全面支持。

硅星人:你如何看待Zilliz在AI生态中的位置?

星爵:Zilliz定位为AI时代的“数据连接器”、AI堆栈不可绕过的数据中间层。无论大模型还是小模型,处理非结构化数据必须经过向量化与检索。

其中,开源的Milvus服务开发者创新,商业化的zilliz cloud支撑企业关键业务

硅星人:这两条产品线将如何协同发展?

星爵: 两者相辅相成。DeepSeek降低大模型落地成本后,越来越多的开发者会首先选择使用开源的 Milvus 来构建解决方案,而当项目进入生产阶段或需要运维支持时,他们会转向 Zilliz Cloud 的商业服务,寻求可靠的托管支持。

在这个过程中,我们专注于打造一个统一的生态系统,例如提供统一的 SDK 和工具链,以确保用户在使用开源版本或云服务时都能享受到一致的开发体验。

Milvus社区是这个产品线之间的重要桥梁,帮助我们将创新快速转化为Zilliz Cloud 的企业功能,同时让企业的需求更有效地反馈到开源产品中。

硅星人:这种开源用户的反馈,在你看来,是zilliz的核心护城河之一吗?

星爵:好的客户,可以告诉你要去往何方,以及你到底是不是自嗨。

比如近几年,生物医药领域开始广泛采用向量表示来处理分子结构、蛋白序列等数据。过去传统数据库无法语义理解分子相似度,但向量数据库可将分子结构编码为向量,实现药物筛选的高效相似搜索。

我们有个客户,就用 Milvus 存储数百万分子指纹向量以发现结构相似的候选药物,加速了新药发现过程。

这一场景下还催生了对二进制向量支持的需求(用于表示分子指纹),也是因此,Zilliz在产品中增加了对二进制嵌入和自定义距离算法的支持,以提升在科研计算场景下的性能。这种反馈积累的多了,就变成了zilliz的隐形know how。

硅星人:今年你还看好向量数据库在哪些场景爆发?

星爵:首先是AI Agent,现在越来越多企业开发类 ChatGPT 的AI Agent(智能体)用于对话客服、虚拟助手等。这类应用要求智能体能”记住”大量历史交互和知识库信息,而LLM自身短暂的上下文长度不足以胜任,相应的,向量数据库正成为这类Agent的标配记忆大脑。

不过向量数据库的潜力远不止问答,而是延展到几乎所有需要理解非结构化数据的AI应用。也是因此,Zilliz 在产品路线中更加注重通用性和灵活性,增加了 Range Search(自定义相似度阈值检索)等功能,以适配”不确定结果数量”的查询场景,满足不同领域复杂多样的需求。

比如,关于个性化推荐与多模态搜索,近两年电商的“猜你喜欢”已经成为标配,该场景需要毫秒级延迟和按需过滤(如按尺码、价格过滤商品),而且商品数据包含文本描述和图片等多模态信息。为满足这些需求,Zilliz Cloud 提供了动态模式(schema)和 JSON 字段支持,将结构化属性与向量嵌入结合存储,方便执行精细的属性过滤;同时 Cardinal 引擎确保了在开启多重过滤的情况下查询仍可在10ms内返回结果。

除此之外,金融风控中的异常检测(寻找最”离群”的向量而非最近邻)、视频内容索引、自动驾驶、网络安全等领域也出现了新颖的向量检索用例。

而在医疗健康领域,医院和制药公司开始利用向量检索病历、文献和分子结构,提高诊断和新药研发现率。

制造业和物联网,也开始用海量传感器数据先转为向量(如机器声音频谱、设备振动信号等),再进行相似模式匹配,实现预测性维护。

总的来说,每一个行业的专业数据(图像、时序、文本等)都有向量化需求,都将催生专门的向量解决方案市场。

硅星人:作为一家全球化公司,Zilliz 在不同市场(美国、亚太、欧洲等)的增长策略有哪些不同?目前哪个市场增长最快?

星爵:作为全球化公司,我们针对不同市场采取差异化策略。在美国市场,我们强调企业级安全性和与现有AI工具链的集成;在欧洲,我们特别关注数据隐私和合规;在亚太地区,我们强调性价比和技术支持。目前美国市场增长最快,特别是在企业SaaS领域。

硅星人:你现在的日常工作节奏是怎样的?与一年前相比,现在什么问题让你夜不能寐?

星爵:如今我的日常工作主要围绕三个方面:战略布局、高速增长和团队建设。目前最让我关注的问题是如何一方面确保开源社区保持活力与创新,另一方面加快商业化步伐,同时在这个竞争越来越白热化的市场环境中,持续巩固和强化Zilliz的独特竞争优势。

硅星人:希望十年后的你是什么样子?

星爵:十年之后?希望愿景成真吧。我希望那时候所有人谈起AI时代的数据基础设施,都能想到Zilliz 是其中的佼佼者。我也期望自己能永远有学习和创新的热情,不断拥抱变化,开拓新的领域。无论如何,都能始终保持一个极客的初心:用技术解决最有挑战的问题。

点个爱心,再走

(文:硅星人Pro)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往