我很笨--学习PG Vector 1个小时我懂得了为什么用HNSW不用IVFFlat （系列 3 ）

AustinDatabases

发布于 2026-03-12 18:36:08

1800

❝开头还是介绍一下群，如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题，有需求都可以加群群内有各大数据库行业大咖，可以解决你的问题。加群请联系 liuaustin3 ，（共3400人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 +9）(1 2 3 4 5 6 7 8群已经爆满 9群 300+，开10群PolarDB专业学习群110+)

我很笨--学习PG Vector 1个小时我懂得了索引基本原理--要不你也试试！！（系列 2 ）

我很笨--学习PGVector的 1个小时我懂得了AI 基本的原理--要不你也试试！！

我们接着上期，在使用PostgreSQL Vector 进行向量学习的过程中，上期我们提出的IVFFlat的查询的案例和基本的原理。

随着查询的维度也就是大模型的维度加大如OPENAI 1536个维度，索引会变得巨大，导致内存溢出，并触发大量的磁盘交换，所以在这里建议使用半精度的方式来，因为这样可以立即节省50%的内存和磁盘空间，就是將vector类型换成halfvec 16位的浮点数，

但这里也有人说，IVFFlat使用的空间换时间，而HNSW是逻辑换时间的方式。IVVFlat是需要先进行训练，然后将数据插入到bucket中，查询扫描一部分bucket，其中核心的点就是数据分布变动，导致精度不稳定，高并发下需要扫描更多的lists才能稳定recall.

所以高维对IVFFlat查询是一个非常不好的查询选择，一句话解释，本来10个人住10个房子，我们进行分类分成10类就好，但是现在1000个人要住10个房子，分类将变得模糊，数据的准确度会降低。

这就导致

所以维度越高，则IVFFLat的方案越不行，我们需要更换成HNSW的方案,使用 halfvec的方案。

-- 在 halfvec 类型上创建 HNSW 索引
CREATE INDEX ON items USING hnsw (embedding halfvec_l2_ops) WITH (m = 16, ef_construction = 64);

下面我们模拟一下IVFFlat 和 HNSW 建立索引的不同，下面的案例可以看出为什么在大部分情况，尤其维度比较高的情况下，在PostgreSQL vector 中我们选择的是HNSW，因为在维度较高的情况下，需要更多的内存支持，否则就无法通过 IVFFlat建立索引。

IVFFlat 适合的场景是冷数据，静态数据，批量离线构建，以及内存可以给的足够大的情况适合IVFFLAT建立索引。


CREATE TABLE items_half (
    id bigserial PRIMARY KEY,
    embedding halfvec(1536)
);

INSERT INTO items_half (embedding)
SELECT array_agg(random())::halfvec(1536)
FROM generate_series(1,1000000) AS g(id)
CROSS JOIN LATERAL generate_series(1,1536) AS d(dim)
GROUP BY g.id;


CREATE INDEX idx_items_ivf
ON items
USING ivfflat (embedding vector_l2_ops)
WITH (lists = 1000);

SET ivfflat.probes = 10;

SELECT *
FROM items
ORDER BY embedding <-> '[...]'
LIMIT 10;

HNSW

CREATE INDEX idx_items_hnsw
ON items_half
USING hnsw (embedding halfvec_l2_ops)
WITH (
    m = 16,
    ef_construction = 200
);

SET hnsw.ef_search = 100;

SELECT *
FROM items_half
ORDER BY embedding <-> '[...]'
LIMIT 10;