搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏热爱IT
PostgreSQL全文检索简介转
，对于text类型可以无需强类型转换(::tsvector或to_tsvector(config_name, text))，所以这个操作符实际支持的参数类型是这样的: tsvector @@ tsquery INDEX pgweb_idx ON pgweb USING GIN(to_tsvector('english', title || ' ' || body)); 还可以单独创建一个tsvector列使用了to_tsvector()函数的双参数版本指定了全文检索配置，因此必须使用to_tsvector()相同全文检索配置才能命中索引。比即，WHERE to_tsvector('english', body) @@ 'a & b' 可以使用该索引，但WHERE to_tsvector(body) @@ 'a & b'不能。在使用一个单独的列来存储tsvector表示时，有必要创建一个触发器在title或body改变时保证tsvector列为当前值。详见文档。
6.4K30发布于 2019-05-21
来自专栏全栈程序员必看
PostgreSQL-模糊查询
|\《|\》]' ,'','g'); $$ language sql strict immutable; 4.2 每两个字符做为一个词处理,将字符串转换为tsvector drop function if exists str_to_tsvector(text); create or replace function str_to_tsvector(text) returns tsvector as $$ declare v_count integer; v_txt text; v_txts text[]; v_result tsvector; begin v_txt ..v_count loop v_txts := array_append(v_txts, substring(v_txt,i,2)); end loop; --tsvector from unnest(v_txts) as f group by f ),cte2 as( select f from cte1 order by f )select array_to_tsvector
3.3K20编辑于 2022-08-24
来自专栏四楼没电梯
PostgreSQL pg_trgm中文模糊匹配优化技巧
方案二：结合全文检索（tsvector） PostgreSQL 内置全文搜索（Full Text Search）可与 trigram 互补。可通过将文本字段转换为 tsvector 实现更灵活的匹配： ALTER TABLE users ADD COLUMN name_tsv tsvector GENERATED ALWAYS AS (to_tsvector('simple', name)) STORED; CREATE INDEX idx_users_name_tsv ON users USING gin(name_tsv); GENERATED ALWAYS AS (to_tsvector('chinese', name)) STORED; CREATE INDEX idx_users_zh_tsv ON users 十一、实战建议总结场景推荐方案说明少量中文名、地名 ✅ pg_trgm 简单高效中等量文本搜索 ✅ tsvector('simple') 基础全文索引中文内容库（>百万行） ✅ zhparser
62010编辑于 2025-10-31
来自专栏云计算教程系列
Ubuntu 16.04如何使用PostgreSQL中的全文搜索
首先，我们需要使用PostgreSQL连接函数||和转换函数to_tsvector()将所有列放在一起。这是因为函数to_tsvector()规范化每个单词以允许我们找到相同单词的变体形式，然后按字母顺序对结果进行排序。这个数字就是document中单词的位置。函数to_tsquery()将参数（可以是直接或稍微调整的用户搜索）转换为文本搜索条件，该条件将以与to_tsvector()执行相同的方式减少输入。该@@运营商标识，如果tsvector匹配的tsquery或其他tsvector。它返回true或false，这使其易于作为WHERE标准的一部分使用。 sammy=# ALTER TABLE news ADD "document" tsvector; 我们现在需要使用不同的查询将数据插入表中。
4.3K60发布于 2018-07-27
来自专栏枕边书
见招拆招-PostgreSQL中文全文索引效率优化
但填充数组字段需要调用 SELECT to_tsvector('parser', 'nane') 查询后使用脚本处理结果后再写入数组，比较麻烦。修改 tsvector 分词向量字段，手动向此字段添加前缀词的分词向量。但分词向量不同于文本，不能直接拼接。最好的方案当然是最后一种，改动最小，于是我就查询了一下 PostgreSQL 向量拼接，还是找到了向量拼接的方法，使用 ::tsvector 将字符串强转成向量，再使用 || 拼接到原来的分词向量上，SQL 语句类似 SELECT to_tsvector('parser', 'keyword') || 'prefix'::tsvector。
3K80发布于 2018-03-30
来自专栏热爱IT
使用PostgreSQL进行中文全文检索转
// 设置分词规则（n 名词 v 动词等，详情阅读下面的文档）给某一列的分词结果添加 gin 索引 create index idx_name on table using gin(to_tsvector #重要单字复合: 4 zhparser.multi_zall = false #全部单字复合: 8 SQL 查询中我们可以使用最简单的 SELECT * FROM table WHERE to_tsvector 的返回结果为 '国家' & '大剧院' & '大剧' & '剧院' ，当然我们也可以使用 & | 符号拼接自己需要的向量；在查询长句时，可以使用 SELECT * FROM table WHERE to_tsvector 我们接着对分词效果和效率进行优化：存储分词结果我们可以使用一个字段来存储分词向量，并在此字段上创建索引来更优地使用分词索引： ALTER TABLE table ADD COLUMN tsv_column tsvector ; // 添加一个分词字段 UPDATE table SET tsv_column = to_tsvector('parser_name', coalesce(field,''));
2.6K20发布于 2019-04-10
来自专栏枕边书
使用PostgreSQL进行中文全文检索
/ 设置分词规则（n 名词 v 动词等，详情阅读下面的文档）给某一列的分词结果添加 gin 索引 create index idx_name on table using gin(to_tsvector 重要单字复合: 4 zhparser.multi_zall = false #全部单字复合: 8 SQL 查询中我们可以使用最简单的 SELECT * FROM table WHERE to_tsvector 的返回结果为 '国家' & '大剧院' & '大剧' & '剧院' ，当然我们也可以使用 & | 符号拼接自己需要的向量；在查询长句时，可以使用 SELECT * FROM table WHERE to_tsvector 我们接着对分词效果和效率进行优化：存储分词结果我们可以使用一个字段来存储分词向量，并在此字段上创建索引来更优地使用分词索引： ALTER TABLE table ADD COLUMN tsv_column tsvector ; // 添加一个分词字段 UPDATE table SET tsv_column = to_tsvector('parser_name', coalesce(field,''));
3.4K120发布于 2018-01-04
来自专栏AustinDatabases
卷呀卷，Hybrid 混合查询学习--哪个库是小趴菜
NOT EXISTS vector; CREATE TABLE documents ( id serial PRIMARY KEY, content text, content_tsv tsvector GENERATED ALWAYS AS (to_tsvector('english', content)) STORED, embedding vector(384) -- 假设用 OpenAI
34600编辑于 2025-06-19
来自专栏Greenplum
PostgreSQL与SQL Server:为什么 PostgreSQL遥遥领先
全文搜索比较： -- PostgreSQL CREATE INDEX idx_fts ON articles USING gin(to_tsvector('english', content)); SELECT title FROM articles WHERE to_tsvector('english', content) @@ to_tsquery('english', 'database & performance
86710编辑于 2025-09-11
来自专栏运维小路
PostgreSQL-数据类型（data type）
特殊类型 -- 特殊类型 uuid -- 通用唯一标识符 xml -- XML 数据 tsvector -- 文本搜索向量 tsquery - special_example ( user_uuid UUID DEFAULT gen_random_uuid(), document XML, search_index TSVECTOR
40810编辑于 2026-01-26
来自专栏nginx
从理论到实践：构建高效RAG知识库系统的完整指南
section_path VARCHAR(255) NOT NULL, -- 如"2.3.1>2.3>2" chunk_content TEXT NOT NULL, clean_content TSVECTOR idx_section ON knowledge_chunks (book_id, section_path); 关键设计要点：分层存储：section_path字段使用特殊符号记录章节层级关系内容优化：TSVECTOR
2.6K10编辑于 2025-11-16
CodeBuddy协作实战：构建基于多数据库的混合检索 RAG 问答系统开发日志
search_stmt = f""" SELECT id, title, department, tags, ts_rank(to_tsvector ('english', title), plainto_tsquery('english', :query)) as title_rank, ts_rank(to_tsvector tag_rank FROM document_metadata WHERE is_active = 1 AND ( to_tsvector ('english', title) @@ plainto_tsquery('english', :query) OR to_tsvector('english', array_to_string
80310编辑于 2025-09-03
来自专栏四楼没电梯
PostgreSQL `pg_trgm` 扩展实现高效模糊查询实践
安装复杂度简单需启用扩展中文支持 ✅ ✅（推荐 UTF8 编码） ✅ 实战建议对模糊查询频繁的字段（如用户名、标题、商品名），强烈推荐使用 pg_trgm；对搜索引擎类业务，可与全文检索（tsvector
79310编辑于 2025-10-31
来自专栏Debian中国
Postgres 10 开发者新特性
在JSON列上的全文索引与其他列是类似的，因此我们的查询需要使用to_tsquery函数和to_tsvector函数的文本搜索的语法。
2.7K20发布于 2018-12-20
来自专栏数据分析
[PostgreSQL]避开MySQL JSON查询陷阱：PostgreSQL算法应用指南
同时匹配JSON字段：-- 假设order_data里有个notes字段存用户备注CREATE INDEX idx_notes_fulltext ON orders USING GIN ( to_tsvector ('english', order_data ->> 'notes') || to_tsvector('simple', order_data -> 'items' ->> 'sku'));-- item ->> 'sku' as skuFROM orders, jsonb_array_elements(order_data -> 'items') as itemWHERE to_tsvector 范围查询WHERE (order_data -> 'payment' ->> 'amount')::DECIMAL BETWEEN 100 AND 1000-- 模糊匹配（配合全文检索）WHERE to_tsvector
58110编辑于 2025-12-01
来自专栏架构进阶
Postgresql中的检索:中文分词及语义检索
测试 SELECT to_tsvector('chinese_zh', '上海自来水来自海上'); -- 分词结果：'上海':1 '来自':3 '自来水':2 -- 4.
1.2K00编辑于 2025-06-23
来自专栏JiekeXu之路
MOP 系列|MOP 三种主流数据库索引简介
PostgreSQL 全文检索的搜索过程实际上使用一个 tsvector 和 tsquery 进行匹配，tsvector 代表了文档，而 tsquery 代表了检索条件，匹配的运算符是“@@”。 postgres=# select 'We Love PostgreSQL Database'::tsvector; tsvector ----
86610编辑于 2024-04-30
来自专栏AustinDatabases
PostgreSQL Hybrid能力岂非“小趴菜”数据库可比？
这里我将使用pgvector ,GIN/Gist+tsvector，先进行第一期的Hybird的介方案介绍。
29410编辑于 2025-06-25
来自专栏数据和云
详解PostgreSQL数据类型
tsvector类型：表示一个为文本搜索优化的形式下的文档，去除重复分词后按分词顺序存储，可以存储位置信息和权重信息。 tsquery类型：表示一个文本查询，存储查询的分词，可存储权重信息。
2.2K50编辑于 2022-03-04
来自专栏低级Java知识传播者
纯分享：将MySql的建表DDL转为PostgreSql的DDL.md
VARCHAR(43) INET VARCHAR(43) MACADDR VARCHAR(17) UUID VARCHAR(36) XML LONGTEXT JSON LONGTEXT TSVECTOR
2.9K30编辑于 2023-09-12

第 2 页第 3 页

点击加载更多

PostgreSQL全文检索简介转

PostgreSQL-模糊查询

PostgreSQL pg_trgm中文模糊匹配优化技巧

Ubuntu 16.04如何使用PostgreSQL中的全文搜索

见招拆招-PostgreSQL中文全文索引效率优化

使用PostgreSQL进行中文全文检索转

使用PostgreSQL进行中文全文检索

卷呀卷，Hybrid 混合查询学习--哪个库是小趴菜

PostgreSQL与SQL Server:为什么 PostgreSQL遥遥领先

PostgreSQL-数据类型（data type）

从理论到实践：构建高效RAG知识库系统的完整指南

CodeBuddy协作实战：构建基于多数据库的混合检索 RAG 问答系统开发日志

PostgreSQL `pg_trgm` 扩展实现高效模糊查询实践

Postgres 10 开发者新特性

[PostgreSQL]避开MySQL JSON查询陷阱：PostgreSQL算法应用指南

Postgresql中的检索:中文分词及语义检索

MOP 系列|MOP 三种主流数据库索引简介

PostgreSQL Hybrid能力岂非“小趴菜”数据库可比？

详解PostgreSQL数据类型

纯分享：将MySql的建表DDL转为PostgreSql的DDL.md

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

PostgreSQL全文检索简介 转

PostgreSQL-模糊查询

PostgreSQL pg_trgm中文模糊匹配优化技巧

Ubuntu 16.04如何使用PostgreSQL中的全文搜索

见招拆招-PostgreSQL中文全文索引效率优化

使用PostgreSQL进行中文全文检索 转

使用PostgreSQL进行中文全文检索

卷呀卷，Hybrid 混合查询学习--哪个库是小趴菜

PostgreSQL与SQL Server:为什么 PostgreSQL遥遥领先

PostgreSQL-数据类型（data type）

从理论到实践：构建高效RAG知识库系统的完整指南

CodeBuddy协作实战：构建基于多数据库的混合检索 RAG 问答系统开发日志

PostgreSQL `pg_trgm` 扩展实现高效模糊查询实践

Postgres 10 开发者新特性

[PostgreSQL]避开MySQL JSON查询陷阱：PostgreSQL算法应用指南

Postgresql中的检索:中文分词及语义检索

MOP 系列|MOP 三种主流数据库索引简介

PostgreSQL Hybrid能力岂非“小趴菜”数据库可比 ？

详解PostgreSQL数据类型

纯分享：将MySql的建表DDL转为PostgreSql的DDL.md

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

PostgreSQL全文检索简介转

见招拆招-PostgreSQL中文全文索引效率优化

使用PostgreSQL进行中文全文检索转

PostgreSQL Hybrid能力岂非“小趴菜”数据库可比？