向 AI Search 迈进,腾讯云 ES 自研 v-pack 向量增强插件揭秘! 除了紧跟 ES 官方在向量搜索上的大幅优化动作外,腾讯云 ES 还在此版本上默认内置了一个全新的插件 —— v-pack 插件。 v-pack 名字里的"v"是 vector 的意思,旨在提供更加丰富、强大的向量、混合搜索能力。本文将对该版本 v-pack 插件所包含的功能做大体的介绍。 v-pack 会在创建新索引时,自动在索引 settings 中扩增 index.mapping.source.auto_exclude_types 参数来裁剪向量字段。 v-pack 提供的融合算法,支持自定义的灵活组合,可以参考如下的做法来组合使用。
03 向量优化:行存裁剪+量化裁剪+多策略融合排序 除了本身Elastic官方在向量搜索上的大幅优化动作外,腾讯云ES还自研了一个全新的插件 —— v-pack插件,旨在通过给“数据瘦身”+“多策略排序 v-pack插件动态裁剪行存中的冗余向量,相比传统ES把向量数据同时塞进行存和列存,可无损压缩70%+存储。
同时也将介绍腾讯云 ES AI搜索增强版,自研向量增强插件 v-pack 带来的节省 70% - 90% 存储的技术细节解析。 1. 腾讯云 ES 在自研的 v-pack 插件中,使SourceFieldMapper对 _source 中的dense_vector字段进行默认的裁剪,将上一章节中写入流程图的.fdt写入链路优化为如下流程 我们在自研的 v-pack 向量增强插件上对该功能进行了默认开启。无需任何配置,即可以直接使用到降低 70% 存储的优化特性。 4. 5.5 腾讯云 ES 的贡献 **腾讯云 ES 自发完成了该功能实现,并且在腾讯云 ES 新发布的 ES 8.16.1 版本上,集成在了腾讯云自研的 v-pack 向量增强插件中。 目前腾讯云 ES 紧跟社区步伐,发布了 8.16.1 版本,集成了自研的 v-pack 向量增强插件,不断地增加我们的自研功能和优化,我们会在后面带来更多的剖析。
腾讯云 ES 在自研的 v-pack 插件中,使SourceFieldMapper对 _source 中的dense_vector字段进行默认的裁剪,将上一章节中写入流程图的.fdt写入链路优化为如下流程 我们在自研的 v-pack 向量增强插件上对该功能进行了默认开启。无需任何配置,即可以直接使用到降低 70% 存储的优化特性。4. 节省 72% 磁盘3.38GB 节省 90% 磁盘5.5 腾讯云 ES 的贡献腾讯云 ES 自发完成了该功能实现,并且在腾讯云 ES 新发布的 ES 8.16.1 版本上,集成在了腾讯云自研的 v-pack 同时介绍了腾讯云 ES 在向量功能上对 ES 社区的多个 PR 贡献,以及介绍了腾讯云 ES 最新发布的 8.16.1 版本的 v-pack 向量增强插件,带来的「行存裁剪」和「量化裁剪」能力,分别可以做到节省 目前腾讯云 ES 紧跟社区步伐,发布了 8.16.1 版本,集成了自研的 v-pack 向量增强插件,不断地增加我们的自研功能和优化,我们会在后面带来更多的剖析。
最佳实践」腾讯云 Elasticsearch 8.13.3 向量混合检索 赛段2 作品影响力 单篇文章综合得分排名第1 8549468 Rassyan 向 AI Search 迈进,腾讯云 ES 自研 v-pack