首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Milvus 和 PGVector,哪个更好?

Milvus 和 PGVector,哪个更好?

作者头像
苏三说技术
发布2026-04-21 21:05:01
发布2026-04-21 21:05:01
1700
举报
文章被收录于专栏:苏三说技术苏三说技术

大家好,我是苏三,又跟大家见面了。

前言

在做RAG(检索增强生成)应用或推荐系统时,很多小伙伴都会遇到同一个灵魂拷问:向量数据库到底该怎么选?

市面上选项很多,但讨论最激烈、也是让大家最纠结的,往往就是“二选一”——是选择嵌入在PostgreSQL里的pgvector,还是选择专门的向量数据库Milvus?

这两个工具表面上看都在做同一件事——向量相似度搜索,但本质上代表了两种完全不同的系统设计理念。

一个选择把向量检索能力融入现有业务系统,一个选择把向量检索能力做深做精。

今天这篇文章就专门跟大家一起聊聊这个话题,希望对你会有所帮助。

一、两者到底有什么不同?

先给个结论性的对比:

对比维度

pgvector

Milvus

本质

PostgreSQL的一个扩展插件

专为向量打造的独立分布式数据库

设计理念

在关系型数据库里“顺便”做向量检索

把向量检索做到极致

适合数据量

≤500万条

千万级到百亿级

运维复杂度

★☆☆☆☆(极低)

★★★★☆(较高)

典型场景

已有PostgreSQL的中小项目

大规模、高性能AI应用

如果用一个比喻来理解:pgvector就像在你的家庭小厨房里加了一台空气炸锅,偶尔炸个薯条完全够用,还不占地方。

Milvus则像一个专业的中央厨房,能同时处理几百桌订单,但你需要单独租场地、雇人、维护设备。

二、它们到底是怎么做向量检索的?

在对比之前,我们先搞懂一个核心问题:向量检索的本质是什么?

向量检索就是在一堆高维空间里的点中,找到离目标点最近的K个点。

如果暴力计算(把所有点都算一遍),数据量一大就慢如蜗牛。

所以,必须用索引来加速——就像书的目录,让你不用翻完整本书就能找到内容。

pgvector和Milvus都采用了两种主流索引:IVF(倒排文件索引)HNSW(分层导航小世界)

但它们的实现方式和优化方向完全不同。

2.1 pgvector的索引原理

pgvector直接在PostgreSQL的存储引擎之上增加了一种新的数据类型vector,并利用PostgreSQL的索引接口实现了IVFFlat和HNSW索引。

IVFFlat原理图

HNSW原理图

pgvector把这两种索引算法“塞进”了PostgreSQL的B-tree索引框架中。

好处是:你创建索引的语法和普通B-tree几乎一样,PostgreSQL的查询优化器能自动决定是否使用向量索引。

但缺点也很明显——pgvector不能利用多核并行扫描,也无法使用GPU加速,因为PostgreSQL本身不支持这些特性。

2.2 Milvus的索引原理

Milvus是为向量检索从头设计的系统,它的索引层是一个独立的、高度优化的模块。

Milvus整体架构

Milvus的索引节点可以并行构建索引,查询节点可以并发执行搜索。它支持10+种索引算法,包括:

  • HNSW:基于图的索引,查询快,内存占用大
  • IVF_FLAT:聚类+全精度,召回率高
  • IVF_PQ:乘积量化,内存压缩8-16倍
  • GPU索引:利用CUDA加速,延迟可降至亚毫秒级
  • DiskANN:磁盘索引,支持百亿级数据

Milvus的HNSW索引查找过程(多线程并行)

正是这种“存储计算分离”和“并行执行”的架构,让Milvus在处理千万级以上向量时,性能远超pgvector。

三、核心功能深度对比

3.1 向量类型与索引

功能

pgvector

Milvus

稠密向量

稀疏向量

基础支持

✅ 原生支持

二值向量

动态Schema

索引类型

HNSW, IVFFlat

10+种(含GPU索引)

量化压缩

✅ PQ/GPQ/INT8/1-bit

磁盘索引

✅ DiskANN

3.2 混合检索能力

pgvector的最大优势是混合检索非常自然——用SQL一条语句搞定:

代码语言:javascript
复制
SELECT * FROM products 
WHERE category = 'electronics' 
  AND price < 1000
ORDER BY embedding <=> query_vec 
LIMIT 10;

Milvus也支持标量过滤,但过滤条件需要写在表达式里,不如SQL直观:

代码语言:javascript
复制
results = collection.search(
    data=[query_vec],
    anns_field="embedding",
    param={"metric_type": "IP"},
    limit=10,
    expr="category == 'electronics' && price < 1000"
)

3.3 事务与一致性

pgvector继承了PostgreSQL的ACID事务,适合需要强一致性的金融、订单等场景。Milvus提供最终一致性,更注重高吞吐和低延迟。

3.4 硬件加速

Milvus支持GPU索引(GPU IVF、GPU HNSW),利用CUDA加速,查询延迟可以降低到亚毫秒级。pgvector没有GPU支持。

四、性能实测

根据多家机构的基准测试,两者在不同规模下的性能表现差异明显:

百万级向量测试(128维):

指标

pgvector

Milvus

QPS

1,200

3,500

延迟

8-12ms

3-5ms

精确度

98.7%

99.2%

千万级向量测试(768维BERT向量,4节点集群):

指标

Milvus

pgvector

写入吞吐量

~12万向量/秒

~1.5万向量/秒

查询延迟(缓存)

~20ms

~120ms

磁盘占用

1.5倍原始大小

2.2倍原始大小

结论很清晰:在小规模数据(≤500万)下,pgvector的性能完全够用。

但数据量达到千万级以上时,Milvus在写入吞吐量和查询延迟上的优势开始变得非常明显。

五、运维复杂度

这是两者差异最大的维度。

pgvector部署(一行SQL):

代码语言:javascript
复制
CREATE EXTENSION vector;

备份用pg_dump,高可用用repmgr或Patroni,全部复用PostgreSQL生态,不需要学习任何新工具。

内存占用方面,100万条以下数据,pgvector可控制在2GB以内。

Milvus部署(需要Docker Compose或K8s):

代码语言:javascript
复制
# docker-compose.yml 片段
services:
etcd:
    image:quay.io/coreos/etcd:v3.5.5
minio:
    image:minio/minio:latest
standalone:
    image:milvusdb/milvus:v2.6.0
    depends_on:
      -etcd
      -minio

即便是单机版,也需要同时运行etcd、MinIO和Milvus三个容器。

生产环境集群还需要配置Pulsar或Kafka。

不过,Milvus 2.6版本做了大量简化工作,例如内置Woodpecker消息队列,降低了对Kafka的依赖。

一句话总结:如果你只有一台2核4G的云服务器,pgvector是最务实的方案;如果你有专门的机器或K8s集群,可以考虑Milvus。

六、代码实战

6.1 pgvector完整示例

代码语言:javascript
复制
-- 1. 安装扩展
CREATE EXTENSION vector;

-- 2. 创建带向量列的表
CREATETABLE documents (
    idSERIAL PRIMARY KEY,
    contentTEXT,
    embedding VECTOR(1536),      -- 1536维嵌入
    categoryTEXT,
    created_at TIMESTAMPDEFAULTNOW()
);

-- 3. 创建HNSW索引(加速检索)
CREATEINDEXON documents USING hnsw (embedding vector_cosine_ops);

-- 4. 插入向量数据(假设已有embedding数组)
INSERTINTO documents (content, embedding, category) 
VALUES
    ('PostgreSQL向量扩展介绍', '[0.12, -0.34, ...]', '技术'),
    ('Milvus分布式向量数据库', '[0.45, -0.12, ...]', '技术');

-- 5. 执行向量相似度检索
SELECTcontent, 1 - (embedding <=> '[0.11, -0.33, ...]') AS similarity
FROM documents 
WHEREcategory = '技术'
ORDERBY embedding <=> '[0.11, -0.33, ...]'
LIMIT5;

6.2 Milvus完整示例

技术栈使用的Java + Spring AI Alibaba。

pom.xml依赖

代码语言:javascript
复制
<dependency>
    <groupId>com.alibaba.cloud.ai</groupId>
    <artifactId>spring-ai-alibaba-starter-milvus-store</artifactId>
    <version>1.0.0</version>
</dependency>

application.yml配置

代码语言:javascript
复制
spring:
  ai:
    vectorstore:
      milvus:
        host: localhost
        port: 19530
        collection-name: documents
        embedding-dimension: 1536

Java代码

代码语言:javascript
复制
@Configuration
publicclass MilvusConfig {
    @Bean
    public VectorStore vectorStore(EmbeddingModel embeddingModel) {
        returnnew MilvusVectorStore(MilvusVectorStoreConfig.builder()
                .withHost("localhost")
                .withPort(19530)
                .withCollectionName("documents")
                .withEmbeddingDimension(1536)
                .build(), embeddingModel);
    }
}

@Service
publicclass DocumentService {
    @Autowired
    private VectorStore vectorStore;
    
    public List<Document> search(String query, int topK) {
        // 内部自动完成向量化 + 检索
        return vectorStore.similaritySearch(
            SearchRequest.query(query).withTopK(topK)
        );
    }
}

七、优缺点

pgvector:轻量、简单、够用

优点

  • 部署极简,一行SQL即可启用
  • 复用PostgreSQL全套运维体系(备份、高可用、监控)
  • 内存占用低(<100万条可控制在2GB)
  • 支持ACID事务,数据一致性有保障
  • 学习成本几乎为零,直接用SQL
  • 混合检索最自然(SQL标量+向量)

局限

  • 数据量超过500万后性能明显下降
  • 索引类型有限(无PQ等量化压缩)
  • 无内置GPU加速
  • 分布式扩展困难,依赖PostgreSQL原生分片方案
  • 查询节点单线程执行,无法并行

适用场景:数据量<500万、已有PostgreSQL基础设施的中小项目、对运维简单性要求极高的团队、需要强事务一致性的场景。

Milvus:专业、强大、可扩展

优点

  • 原生分布式架构,可水平扩展至百亿级向量
  • 索引类型丰富(10+种),支持GPU加速
  • 写入吞吐量高,延迟低(3-5ms)
  • 2.6版本大幅优化内存和成本(INT8压缩)
  • 支持多种向量类型(稠密/稀疏/二值)
  • 支持动态Schema,灵活适应业务变化

局限

  • 运维复杂度高,需要管理多个组件(etcd、MinIO等)
  • 资源门槛较高(默认8GB+内存)
  • 学习曲线陡峭
  • 与关系型数据的混合查询需要应用层实现
  • 不提供ACID事务(最终一致性)

适用场景:数据量>500万、对查询性能和扩展性要求高的AI应用,如RAG、推荐系统、图像检索、多模态搜索等。

八、如何选择?

总结

回到最初的问题:Milvus和pgvector,哪个更好?

答案很简单:看你的数据规模和业务场景。

  • 如果你的业务数据量在百万级以下,或者你已经在用PostgreSQL,希望保持架构简洁,那pgvector就是最务实的选择。一个扩展、几行SQL,就能把向量检索能力接入现有系统,无需额外维护。
  • 如果你的数据量达到千万甚至亿级以上,对查询延迟写入吞吐量有极致要求,且团队有能力维护分布式系统,那Milvus才是正确的答案。

我个人的建议是:从pgvector起步,用最简单的方案先跑通业务

等数据量真的涨起来、性能瓶颈真正出现时,再考虑迁移到Milvus也不迟。

过早引入复杂的分布式系统,只会增加不必要的运维成本。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 苏三说技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、两者到底有什么不同?
  • 二、它们到底是怎么做向量检索的?
    • 2.1 pgvector的索引原理
    • 2.2 Milvus的索引原理
  • 三、核心功能深度对比
    • 3.1 向量类型与索引
    • 3.2 混合检索能力
    • 3.3 事务与一致性
    • 3.4 硬件加速
  • 四、性能实测
  • 五、运维复杂度
  • 六、代码实战
    • 6.1 pgvector完整示例
    • 6.2 Milvus完整示例
  • 七、优缺点
    • pgvector:轻量、简单、够用
    • Milvus:专业、强大、可扩展
  • 八、如何选择?
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档