是否可以将Postgres配置为在多个CPU进程上拆分全文搜索,以便更快地完成?
我正在对杜松子酒索引的the列上的200万条记录进行全文搜索,其中的源文本大约有10,000个字符。
我比在搜索期间使用的CPU要多得多,所以我觉得将搜索分割成500 K的批处理将使它能够同时运行搜索,从而更快地完成搜索。
我想知道是否有人尝试过这种方法,或者用SQL编程实现了他们自己的等价功能。
发布于 2019-10-24 15:03:43
默认的"max_parallel_workers_per_gather“设置为2,这不会将工作分散到任何一个查询的所有4个CPU上。但这并不重要,如果你没有得到平行的计划在第一。
并行查询是PostgreSQL的一个相对较新的特性,目前还在改进中。你应该使用最新的版本,你可以给自己最好的机会从中受益。
我相信索引谘询不能并行(在任何版本)。餐桌上的协商是可以的,但这往往是没有意义的。
如果查询的索引部分具有很高的选择性,并且返回了几行,那么"parallel_setup_cost“将超过只对几行并行化表访问的好处。
另一方面,如果您返回了很多行,那么"parallel_tuple_cost“(乘以返回的行)将超过收益。如果您访问了很多行,但不要返回它们(比如count(*)或其他聚合,或者索引无法处理的筛选器),这是并行化工作良好的最佳情况。
https://dba.stackexchange.com/questions/251844
复制相似问题