首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏milvus数据库

    pymilvus创建IVF_SQ8向量索引

    目前,向量字段仅支持一种索引类型,即只能创建一个索引。 milvus支持的向量索引类型大部分使用近似最近邻搜索算法(ANNS,approximate nearest neighbors search) 。 IVF_SQ8索引由于IVF_FLAT未对原始的向量数据做任何压缩,IVF_FLAT索引文件的大小与原始数据文件大小相当。 当磁盘或内存、显存资源有限时,IVFSQ8是一个更好的选择。 它通过对向量进行标量量化(Scalar Quantization),能把原始向量中每个FLOAT(4字节)转为UINT8(1字节),从而可以把磁盘及内存、显存资源的消耗量减少70% ~ 75%。

    56410编辑于 2024-04-08
  • 来自专栏腾讯云Elasticsearch Service

    ES8 向量功能窥探系列(二):向量数据的存储与优化

    导语在上一篇文章《ES8 向量功能窥探系列(一):混合搜索功能初探与增强》中,我们初步探讨了 Elasticsearch 8.x 的混合搜索功能,包括 kNN 查询流程、RRF 融合算法以及相关的功能增强 我们会重点探究在 ES8 引入向量功能后所发生的变化。本文所引用代码均为 ES 8.16.1 版本。 事实上,在int8_hnsw的配置下,.vec是原始 32bit 的float32的向量,.veq是标量量化后所得到的 8bit 的int8(有符号的int7)的向量,所以存储大小差不多是前者的 1/4 在前文中提到,通过.veq文件可以获取到量化后的int8向量。事实上,.veq和.vec的读写方式和格式都如出一辙,唯一不同的就是向量值类型。 veb的大小下降为.veq的约 1/8,这与两者的量化程度分别为 8bit 和 1bit 吻合。.vex大小始终未发生太大波动,因为它只包含 HNSW 图的节点和边信息,并不包含向量原始值。

    1.9K10编辑于 2025-02-20
  • 来自专栏陶士涵的菜地

    客服系统个性化训练GPT知识库+知识库列表中新增向量搜索功能+语义文本搜索

    大家都知道想要实现个性化训练的GPT,离不开向量数据库。 在我的客服系统后台,能够展示出向量库里的数据列表。现在有一个新需求,客户添加的数据很多,想要能够在后台搜索指定的数据,方便去修改。 新增搜索功能后,后台界面展示如下: 搜索部分也是基于的Qdrant数据库的search 接口,该接口需要把搜索的文本转成向量后,再通过向量去搜索相关数据。 所以,还是需要调用下gpt的 /v1/embeddings ,把搜索的关键词转为向量。 拿到向量再去调用qdrant数据库的  /collections/集合/points/search ,就可以把关键词通过语义文本相似性搜索出相关的数据 看看下面的效果,我胡乱写的搜索关键词,正常的分词搜索是搜不出数据的 ,现在通过向量搜索就能搜出来了

    44320编辑于 2023-07-21
  • 来自专栏陶士涵的菜地

    开发GPT知识库功能时,需要上传word文档让知识库向量化,Golang读取word文档功能

    开发GPT知识库功能时,需要上传word文档让知识库向量化,Golang读取word文档功能。

    1.1K10编辑于 2023-04-21
  • 向量检索+NLU:AI知识库高效检索的核心逻辑与实操

    而语义化AI问答和向量检索式AI搜索,则从根本上解决了传统知识库的关键词检索瓶颈,传统基于倒排索引的搜索方式常出现“搜不到”“搜不准”的情况,比如查询“如何解决HTTP接口调用超时的服务端问题”,关键词搜索仅能返回含 “超时”的零散文档,而系统的AI搜索通过自然语言理解(NLU) 解析用户查询意图,结合知识库的内容向量库做精准匹配,AI问答还能基于知识库语料做上下文关联推理,直接给出结构化的解决方案,无需再逐篇翻找整合信息 实操中还可利用其批量离线文件导入接口,将过往散落的Word、PDF、MD格式文档一次性批量迁入知识库,结合系统的内容结构化解析能力完成文档格式归一化,大幅降低知识库初期的内容迁移成本。 系统的第三方体系无缝集成能力依托轻量化的API接口与WebHook机制实现,让知识库的使用场景得到无限延伸,这也是我在团队落地时最看重的特性。 我们团队日常基于飞书做协同办公,通过调用系统的机器人开发接口,快速实现飞书智能问答机器人的开发与部署,同事在飞书群内通过@机器人即可发起知识库查询,无需跨平台操作;同时将知识库的网页挂件组件嵌入公司官网产品板块

    22510编辑于 2026-02-28
  • 艾体宝产品丨Redis 8 向量搜索实测:轻松扩展至 10 亿向量

    面对生成式 AI 带来的超大规模向量需求,Redis 8 向量搜索实测轻松支持 10 亿向量,依旧保持低延迟与高吞吐表现。 无论是 AI 检索、推荐系统还是多模态生成应用,Redis 8 都是你构建高效向量服务的可靠选择。 将向量搜索扩展到 10 亿个向量并非易事,但 Redis 8 的发布让这一过程显得轻松。 测试结果在十亿向量规模下,使用实时索引,Redis 8 社区版可以维持每秒 66K 向量插入,对于允许至少 95% 精确度(M 16 和 EF_CONSTRUCTION 32)的索引配置。 Redis 8 证明了实时向量搜索不仅适用于数百万个向量,还能扩展到数十亿个向量,同时保持高性能。

    58110编辑于 2025-05-22
  • 来自专栏YO大数据

    【AI大模型】Embedding模型解析 文本向量知识库的构建和相似度检索

    是将文字或短语转换成数值向量的过程。这些向量捕捉了单词的语义特征,例如意义、上下文关系等。 当我们使用向量化模型(如OpenAI的text-embedding-ada-002模型)将文本转化为向量后,每个向量的维度表示某种语义特征,向量中的值反映了相应特征的强度。 | 分别是这两个向量的欧几里得范数(即向量的长度)。 这个比例的本质是测量两个向量之间夹角的余弦值,范围从-1到1: 当余弦值为1时,表示两个向量方向完全相同。 当余弦值为0时,表示两个向量正交,即在高维空间中不相关。 后续会使用到向量数据库 完成知识库的搭建 欢迎小伙伴们 点赞、收藏⭐、留言 有问题可以咨询主页

    14.5K21编辑于 2024-05-25
  • 向量检索与NLP赋能:开源知识库的技术核心与应用场景

    此类AI大模型驱动的开源知识库系统,基于AGPL-3.0开源协议开发,依托大模型微调适配、向量数据库检索、RESTful API接口等核心技术,凭借智能化功能、灵活的拓展能力与轻量化的部署体验,为不同组织框架下的企业知识管理提供了全新的解决方案 (四)AI检索与问答:实现组织内的“知识找人”传统关键词检索模式往往存在“检索结果与需求匹配度低”的问题,而此类开源知识库的AI语义检索基于向量数据库(如Milvus、Chroma)、BERT语义模型, 针对集团型企业跨子公司、跨部门的知识查询需求,AI可通过跨库向量检索、分布式查询,打破组织边界,整合全集团的相关知识;针对事业部制企业各业务线的专业知识查询需求,AI可通过领域知识库微调,精准匹配业务线专属知识 依托私有化部署,基于容器化部署(Docker+K8s)、数据加密存储,实现知识数据的统一管控,保障集团数据安全,同时通过跨库授权、API网关鉴权实现核心知识的按需共享,避免知识孤岛;4. 在部署层面,该开源知识库支持私有化部署、公有云部署与混合云部署,基于容器化部署(Docker+K8s)、云原生架构,不同组织框架的企业可根据自身数据安全需求与运营模式选择适配的部署方式:集团型企业对数据安全要求高

    22410编辑于 2026-03-11
  • 基于 AutoFlow 快速搭建基于 TiDB 向量搜索的本地知识库问答机器人

    导读本文将详细介绍如何通过 PingCAP 开源项目 AutoFlow 实现快速搭建基于 TiDB 的本地知识库问答机器人。 AutoFlow 是 PingCAP 开源的一个基于 Graph RAG、使用 TiDB 向量存储和 LlamaIndex 构建的对话式知识库聊天助手。 启动知识库应用运行以下 docker compose 命令启动知识库应用程序:cd autoflowdocker compose -f docker-compose-cn.yml up -d --force-recreate 网页访问和配置知识库应用应用启动成功后,我们可以直接通过默认的 3000 端口访问相应的界面进行下一步操作了。 体验智能问答至此,我们已经完成了配置数据源并完成了向量化存储及向量索引的创建。

    36410编辑于 2024-12-05
  • 来自专栏夕阳醉了

    基于GPT搭建私有知识库聊天机器人(三)向量数据训练

    本文将重点介绍数据训练的流程,以及如何加载、切割、训练数据,并使用向量数据库Milvus进行数据存储。 1. 数据训练依赖于向量数据库 在本文中,我们使用了Milvus作为向量数据库。 读者可以参考之前的文章《基于GPT搭建私有知识库聊天机器人(二)环境安装》来准备其他基础环境。 2. 数据训练流程 数据训练的流程包括准备PDF文档、上传至系统文件目录、开始训练、加载文件内容、内容切割和存储至向量数据库。下面是整个流程的流程图: 3. UnstructuredPowerPointLoader, {}), ".pptx": (UnstructuredPowerPointLoader, {}), ".txt": (TextLoader, {"encoding": "utf8" 总结 在本文中,我们详细介绍了基于GPT搭建私有知识库聊天机器人的数据训练过程,包括数据训练的依赖、流程和代码展示。数据训练是搭建聊天机器人的重要步骤,希望本文能对读者有所帮助。

    1.1K40编辑于 2023-10-16
  • 来自专栏机器学习与自然语言处理

    Stanford机器学习笔记-8. 支持向量机(SVMs)概述

    8. Support Vector Machines(SVMs) Content 8. 首先,我们通过图8-1所示的二维的0/1线性分类情况来直观感受。 ? 图8-1 SVM Decision Boundary: Linearly separable case 直观上,应该去找位于两类训练样本"正中间"的划分超平面,即图8-1的黑色直线(二维),因为该划分超平面对训练样本局部扰动的 2-范数(2-norm): 也可称长度(length),是二维或三维空间向量长度的推广,向量u记为||u||。 向量内积是几何向量数量积(点积)的推广,可以理解为向量a在向量b上的投影长度(范数)和向量b的长度的乘积。 image.png ?

    1.1K120发布于 2018-03-13
  • 来自专栏coder

    RAG实操教程langchain+Milvus向量数据库创建你的本地知识库

    什么是 RAG RAG 是retrieval-augmented-generation的缩写,翻译为中文的意思就检索增强,以基于最新,最准确的数据建立LLM 的语料知识库。 LLM 现存的痛点 我们知道 LLM 的知识库是通过现有的网络公开的数据作为数据源来训练的,现在公开的很多模型他们基于的训练数据会比我们现在网络上公开的数据早很多,那自然就会产生一种问题,网络上最新的数据和知识 保存拆分好的文档保存到向量数据库中。 设计向量数据库的数据库、集合、字段,索引等信息。 向量化+存储 上面已经说明了向量库以及embedding model的关系。我们直接使用 langchain 提供的工具连完成 embedding 和store。 0.2, "top_p": 0.95, "stream": true }' 对比pdf中的内容,很明显这个结果就是对的: 总结: 本文主要是介绍了使用 langchain+ Milvus向量数据库构建一个知识库的示例

    4.4K11编辑于 2024-09-06
  • 来自专栏AI进修生

    【闭门会干货】字节 AI 最新动态:豆包升级+提示词神器+ SOTA 向量模型 + AI知识库

    这模型在能力上又升了一级,第一次能把视频也向量化了,让多模态搜索和理解更深入。在所有向量化场景里,它都称得上是最佳选择。 采用 K8s 1.26 集群,配 Prometheus 监控,有私有镜像仓库,外网访问需审批。请出含环境检查、部署流程等的详细方案。 redirectURI=%2Fvikingdb%2Fknowledge%2Fregion%3Avdb-knowledge%2Bcn-beijing%2Fcollection%2Flist Viking:字节的知识库向量库 基于这个向量数据库,字节还搞了个好用的知识库产品。升级后的知识库,支持图、文、视频的多模态处理和混排输出,在国内外的评测里效果都更好了。 活动时间: 当前阶段:从现在开始,一直到 2025 年 8 月 31 日。 完整周期:从现在开始,到 2025 年 11 月 30 日结束。 以上。

    1.5K10编辑于 2025-08-04
  • 来自专栏AI

    教你如何用n8n实现一个知识库

    本文档详细介绍如何使用n8n搭建一个完整的知识库系统,包括文档索引、向量化存储和智能检索功能。 通过本指南,你将学会:如何配置ModelScope的Embedding API如何使用Pinecone存储向量数据如何在n8n中构建完整的RAG(检索增强生成)流程常见问题的排查和解决方法一、系统架构1.1 编排整个数据处理流程 Embedding服务ModelScope (Qwen3-Embedding-0.6B)将文本转换为1024维向量向量数据库 Pinecone Name: Api-Key Value: your-pinecone-api-key点击 Save四、创建工作流4.1 工作流概览创建新工作流:知识库 Pinecone向量数据结构:为什么需要生成随机ID?

    1.4K00编辑于 2025-11-18
  • 来自专栏一直在跳坑然后爬坑

    向量空间相关概念总结-向量

    n维向量: ? n维列向量 ? n维行向量 两个向量相等:大小相等,方向相同 ? 向量相等 向量的长度:就是起点与终点的距离,记作: ? 向量长度 向量的方向: 用向量和它坐标轴的夹角来表示,比如: ? 向量方向 向量平行:两个向量方向相同或相反就算平行 零向量:起点和终点是同一个点,零向量长度是0,注意,零向量与任何一个向量平行,他虽然长度为0,但是他却有无穷多的方向 基础运算 向量加法 当然,如果两个边共线了,那第三个边等于前两个边之和 向量数乘:就是一个向量乘以一个数。比如一个向量乘以k,几何意义就是这个向量放大了k倍,k如果是负数那方向就反过来了。 k如果是0的话那这个向量就变成零向量了。其实根据字面意思也好理解,就是k倍的某向量嘛,所以向量的各个维度都应该放大k倍,这样就好理解向量的代数表示了。

    1.4K20发布于 2018-10-10
  • 来自专栏深度学习与python

    Redis 8向量相似性推出新的数据结构

    向量集合 是一种类似于有序集合(Sorted Set)的数据类型,不一样的是它将字符串元素与向量(而不是分数)关联起来,可以添加项目并检索与指定向量最相似的子集。 你可以查询与给定向量(或集合中已有的某个元素的向量)相似的元素,等等。 向量集合基于 hnsw.c 的 HNSW 数据结构实现,并进行了速度和特性方面的扩展。 它使用专门的嵌入模型对已知的人脸图像进行建模,并将映射后的向量存储在 Redis 中,然后通过搜索在数据库中存储的向量来实现人脸识别。 专注于高性能,Sanfilippo 不仅对 HNSW 进行了修改,还为所有向量相似性搜索请求引入了多线程特性,并支持 8 位和二进制量化。 向量集合功能随 Redis 8 RC1 发布,目前处于预览阶段,许可协议为 RSALv2 或 SSPLv1。

    49610编辑于 2025-05-12
  • CentOS安装最新Elasticsearch8支持向量数据库

    大家都知道Elasticsearch是支持向量的存储和查询的,今天我们来介绍下如何安装支持向量数据库的Elasticsearch , 操作环境是CentOS。 <EOF | sudo tee /etc/yum.repos.d/elasticsearch.repo[elasticsearch]name=Elasticsearch repository for 8. x packagesbaseurl=https://artifacts.elastic.co/packages/8.x/yumgpgcheck=1gpgkey=https://artifacts.elastic.co

    44810编辑于 2025-05-22
  • 来自专栏大数据生态

    「最佳实践」腾讯云 ES 8 向量化语义混合检索测试指南

    环境配置 客户端环境 ● 版本 CVM 镜像:CentOS 7.9 64位 | img-l8og963d | 20GiB Linux环境:Centos 7.9 Python:3.9.12 Elasticsearch ES ● vector_search.py:将查询的关键词推理转化成向量,然后对 ES 发起向量检索 5. 语义检索 所有准备工作就绪,下面将演示向量检索,我们分别用向量检索和分词检索测试两者的检索效果: cd /root/tencent-es_vector/ vim vector_search.py 修改配置信息 创建界面 st.set_page_config(layout="wide") st.markdown("

    腾讯云 Elaticsearch 8 ● ES 也支持在在混合检索场景使用聚合查询 8.

    1.3K4038编辑于 2024-04-11
  • 来自专栏陶士涵的菜地

    基于GPT3.5实现本地知识库解决方案-利用向量数据库和GPT向量接口-实现智能回复并限制ChatGPT回答的范围

    标题有点长,但是基本也说明出了这篇文章的主旨,那就是利用GPT AI智能回答自己设置好的问题 既能实现自己的AI知识库机器人,又能节省ChatGPT调用的token成本费用。 代码仓库地址 document.ai: 基于GPT3.5的通用本地知识库解决方案 下面图片是整个流程: 导入知识库数据 利用openai的向量接口生成向量数据,然后导入到向量数据库qdrant 这段代码会将指定目录下的所有文件读取出来 to_embeddings函数会使用 OpenAI 的 API 将文本内容转换为向量,最后返回一个包含文件名、文件内容和向量的列表。 file_path = os.path.join(root, file) with open(file_path, 'r', encoding='utf-8' title": item[0], "text": item[1]}), ], ) count += 1 查询知识库数据

    7.1K60编辑于 2023-03-25
  • 来自专栏用户画像

    中断向量 中断向量

    2、中断向量:早期的微机系统中将由硬件产生的中断标识码(中断源的识别标志,可用来形成相应的中断服务程序的入口地址或存放中断服务程序的首地址)称为中断向量。 在某些计算机中,中断向量的位置存放一条跳转到中断服务程序入口地址的跳转指令。 3、中断向量地址:存储中断向量的存储单元地址。 存放:存放中断服务程序的入口地址,来存放中断向量(共256个),称这一片内存区为中断向量表。 当响应中断时,硬件自动执行相应中断向量处的跳转代码,然后跳转到具体的中断服务程序的入口地址。 综上所述:中断向量的地址一定是 中断服务程序的入口地址的地址,但中断向量不一定就是中断服务程序的入口地址。

    3.1K40发布于 2018-08-27
领券