首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏叶子的开发者社区

    向量3(静态成员)

    题目描述 为向量1题目实现的CVector类添加私有静态成员sum,在初始化对象的同时,统计所有对象的n维向量和sum。 主函数生成多个对象,测试向量和。 输入 测试次数t 每组测试数据格式如下: 输入m,表示n维向量的数目 后跟m行,每行格式:向量维数n n维向量值 输出 对每组测试数据的m个向量,输出所有向量的分量和sum 输入样例1  2 2 5 1 2 3 4 5 3 4 5 6 3 2 1 2  3 10 20 30 2 11 22 输出样例1 1 2 3 4 5 4 5 6 30 1 2 10 20 30 11 22

    40210编辑于 2023-07-30
  • 来自专栏机器学习算法与Python学习

    支持向量机(SVM)--3

    上次说到支持向量机处理线性可分的情况,这次让我们一起学习一下支持向量机处理非线性的情况,通过引进核函数将输入空间映射到高维的希尔伯特空间,进而将线性不可分转化为线性可分的情况。 好的,让我们详细的了解一下核函数的前世与今生~~~~~~~~ 特征空间的隐式映射:核函数 已经了解到了支持向量机处理线性可分的情况,而对于非线性的情况,支持向量机的处理方法是选择一个核函数 支持向量机的分类函数具有这样的性质:它是一组以支持向量为参数的非线性函数的线性组合,因此分类函数的表达式仅和支持向量的数量有关,而独立于空间的维度,在处理高维输入空间的分类时,这种方法尤其有效,其工作原理如图所示 当然,推导过程也并不是可以简单地直接类比的,例如,原本我们要求超平面的法向量w,但是如果映射之后得到的新空间的维度是无穷维的,要表示一个无穷维的向量描述起来就比较麻烦。 3.

    97050发布于 2018-04-04
  • 【RAG新范式】超越向量搜索:企业级知识库构建必知的3大RAG高级策略

    #【RAG新范式】超越向量搜索:企业级知识库构建必知的3大RAG高级策略摘要:本文深度剖析企业级知识库构建中RAG(检索增强生成)技术的进阶实践。 :展开代码语言:TXTAI代码解释graphTDA[用户问题]-->B[向量化]B-->C[相似度计算]C-->D[TOP3文档片段]D-->E[LLM生成回答]E-->F[错误答案]styleFfill (question)#2.向量相似度检索results=vector_search(query_vector,knowledge_base)#3.上下文组装context="\n".join([doc.snippetfordocinresults 当知识库超过百万文档时,该框架会出现:召回率下降38%(测试数据)平均响应延迟>2.3秒复杂问题准确率仅61%2.2企业级知识库的特殊挑战与传统互联网搜索不同,企业场景要求:维度互联网搜索企业知识库挑战指数文档规模亿级百万级 C-->|是|D[术语知识库匹配]C-->|否|E[标准处理]D-->F[标准化表述]F-->G[新查询组装]图示说明:当用户说“碎屏险”,系统自动映射到知识库中的标准术语“屏幕损坏保险(条款编号INS

    33710编辑于 2026-02-06
  • 来自专栏陶士涵的菜地

    客服系统个性化训练GPT知识库+知识库列表中新增向量搜索功能+语义文本搜索

    大家都知道想要实现个性化训练的GPT,离不开向量数据库。 在我的客服系统后台,能够展示出向量库里的数据列表。现在有一个新需求,客户添加的数据很多,想要能够在后台搜索指定的数据,方便去修改。 新增搜索功能后,后台界面展示如下: 搜索部分也是基于的Qdrant数据库的search 接口,该接口需要把搜索的文本转成向量后,再通过向量去搜索相关数据。 所以,还是需要调用下gpt的 /v1/embeddings ,把搜索的关键词转为向量。 拿到向量再去调用qdrant数据库的  /collections/集合/points/search ,就可以把关键词通过语义文本相似性搜索出相关的数据 看看下面的效果,我胡乱写的搜索关键词,正常的分词搜索是搜不出数据的 ,现在通过向量搜索就能搜出来了

    44320编辑于 2023-07-21
  • 来自专栏陶士涵的菜地

    开发GPT知识库功能时,需要上传word文档让知识库向量化,Golang读取word文档功能

    开发GPT知识库功能时,需要上传word文档让知识库向量化,Golang读取word文档功能。

    1.1K10编辑于 2023-04-21
  • 来自专栏六月-游戏开发

    三维数学(3)-向量运算

    公式:[x1,y1,z1] [x2,y2,z2] = [y1z2-z1y2,z1x2-x1z2,x1y2-y1*x2] 几何意义:结果为两个向量所组成面的垂直向量,模长为两向量模长乘积再乘夹角的正弦值 API:Vector3 vec = Vector3.Cross(a,b); 结果与角的关系 叉乘所得向量的模长与角度的关系:0~90度角 Vector3 cross = Vector3.Cross 判断两向量的相对位置。 实例 判断两向量之间的夹角是否大于60度 float dot = Vector3.Dot(v1.normalized, v2.normalized); //写法一,优点:可读性好,缺点:效率差些 float 画出两向量的叉乘向量 先放置两个cube,并画出指向cube的两向量,再画出两向量的叉乘向量,代码如下: private void Demo2() { Debug.DrawLine(Vector3

    1.6K20编辑于 2022-12-26
  • 向量检索+NLU:AI知识库高效检索的核心逻辑与实操

    而语义化AI问答和向量检索式AI搜索,则从根本上解决了传统知识库的关键词检索瓶颈,传统基于倒排索引的搜索方式常出现“搜不到”“搜不准”的情况,比如查询“如何解决HTTP接口调用超时的服务端问题”,关键词搜索仅能返回含 “超时”的零散文档,而系统的AI搜索通过自然语言理解(NLU) 解析用户查询意图,结合知识库的内容向量库做精准匹配,AI问答还能基于知识库语料做上下文关联推理,直接给出结构化的解决方案,无需再逐篇翻找整合信息 实操中还可利用其批量离线文件导入接口,将过往散落的Word、PDF、MD格式文档一次性批量迁入知识库,结合系统的内容结构化解析能力完成文档格式归一化,大幅降低知识库初期的内容迁移成本。 系统的第三方体系无缝集成能力依托轻量化的API接口与WebHook机制实现,让知识库的使用场景得到无限延伸,这也是我在团队落地时最看重的特性。 我们团队日常基于飞书做协同办公,通过调用系统的机器人开发接口,快速实现飞书智能问答机器人的开发与部署,同事在飞书群内通过@机器人即可发起知识库查询,无需跨平台操作;同时将知识库的网页挂件组件嵌入公司官网产品板块

    22510编辑于 2026-02-28
  • 来自专栏技术趋势

    chatGLM3+chatchat实现本地知识库

    落地方案 通过chatGLM3-6B+langchain-chatchat+bge-large-zh实现本地知识库库。 AI-ModelScope/bge-large-zh.git #需要梯子 git lfs install git clone https://huggingface.co/THUDM/chatglm3- init_database.py --recreate-vs 然后会在config中生成如下: 文件名称 说明 basic_config.py 基础配置,用于配置日志相关 kb_config.py 向量数据量配置 配置端口及host等 配置修改 model_config.py 修改如下: MODEL_ROOT_PATH =存放你模型的路劲(不需要指定到模型位置) EMBEDDING_MODEL=向量数据库名称 项止 访问页面:127.0.0.1:8501 最后 试了最新的chatchat发现这个版本在识别agent中的utils有时生效有时无效,官方也承认有这个问题,建议后续还是用官方的chatGLM3

    78410编辑于 2024-03-22
  • 来自专栏Unity3d程序开发

    u3d计算向量间夹角

    float AngleGet(Vector3 from, Vector3 to) { Vector3 v3 = Vector3.Cross(from, to); if (v3.z > 0) return Vector3.Angle(from, to); else return 360 - Vector3 .Angle(from, to); } 这里的v3.z 要根据实际情况取 例如替换为v3.y

    22820编辑于 2023-08-24
  • 来自专栏YO大数据

    【AI大模型】Embedding模型解析 文本向量知识库的构建和相似度检索

    目录导航 1 什么是Embedding 2 为什么使用Embedding 3 数据向量化的处理流程 4 Embedding实战 1 什么是Embedding 在大模型中,"embedding"指的是将某种类型的输入数据 embedding通常通过大量数据的训练而得到,能够捕捉到复杂的模式和深层次的关系,这是传统方法难以实现的 3 数据向量化的处理流程 1. 3. 嵌入 在切块后,每个文本块将被转换为数值向量,即通过OpenAI的embedding API进行嵌入。这一步涉及调用API,将文本数据发送到OpenAI的服务器,服务器会返回文本的向量表示。 ) # vec3 = embed_text(text3) # # # 计算相似度 # similarity12 = cosine_similarity(vec1, vec2) # similarity13 后续会使用到向量数据库 完成知识库的搭建 欢迎小伙伴们 点赞、收藏⭐、留言 有问题可以咨询主页

    14.5K21编辑于 2024-05-25
  • 来自专栏哈哈熊

    【wiki知识库】01.wiki知识库前后端项目搭建(SpringBoot+Vue3

    环境准备 想要搭建自己的wiki知识库,要提前搭建好自己的开发环境,后端我使用的是SpringBoot,前端使用的是Vue3,采用前后端分离的技术实现。 数据库的搭建 新建一个名为wiki的知识库,然后字符集和排序规则选择我选的就可以。 数据库的代码如下。 INSERT INTO `doc` VALUES (1, 1, 0, '文档1', 1, 2, 0); INSERT INTO `doc` VALUES (2, 1, 1, '文档1.1', 1, 3, 0); INSERT INTO `doc` VALUES (3, 1, 0, '文档2', 2, 2, 0); INSERT INTO `doc` VALUES (4, 1, 3, '文档2.1', Vue3环境的搭建 注意:一定要先安装你的Node.js环境。 1.设置淘宝镜像(加速脚手架安装速度) 选择你的项目,并且在IDEA的终端中打开。 输入以下命令。

    1.2K00编辑于 2024-05-27
  • 向量检索与NLP赋能:开源知识库的技术核心与应用场景

    此类AI大模型驱动的开源知识库系统,基于AGPL-3.0开源协议开发,依托大模型微调适配、向量数据库检索、RESTful API接口等核心技术,凭借智能化功能、灵活的拓展能力与轻量化的部署体验,为不同组织框架下的企业知识管理提供了全新的解决方案 在知识架构搭建上,该开源知识库支持结构化与轻量化并存的知识体系搭建模式,基于树形目录结构、标签化分类体系、向量嵌入索引,可根据企业组织框架的层级关系,搭建从企业级、部门级到岗位级的层级化知识目录,也可根据业务场景搭建轻量化的专题知识空间 (四)AI检索与问答:实现组织内的“知识找人”传统关键词检索模式往往存在“检索结果与需求匹配度低”的问题,而此类开源知识库的AI语义检索基于向量数据库(如Milvus、Chroma)、BERT语义模型, 针对集团型企业跨子公司、跨部门的知识查询需求,AI可通过跨库向量检索、分布式查询,打破组织边界,整合全集团的相关知识;针对事业部制企业各业务线的专业知识查询需求,AI可通过领域知识库微调,精准匹配业务线专属知识 3.

    22410编辑于 2026-03-11
  • 基于 AutoFlow 快速搭建基于 TiDB 向量搜索的本地知识库问答机器人

    AutoFlow 是 PingCAP 开源的一个基于 Graph RAG、使用 TiDB 向量存储和 LlamaIndex 构建的对话式知识库聊天助手。 cat > .env <<'EOF'ENVIRONMENT=production# 可使用 python3 -c "import secrets; print(secrets.token_urlsafe 启动知识库应用运行以下 docker compose 命令启动知识库应用程序:cd autoflowdocker compose -f docker-compose-cn.yml up -d --force-recreate Failed to create Embedding ModelCurrently we only support 1536 dims embedding, got 1024 dims.  3. 体验智能问答至此,我们已经完成了配置数据源并完成了向量化存储及向量索引的创建。

    36410编辑于 2024-12-05
  • 来自专栏夕阳醉了

    基于GPT搭建私有知识库聊天机器人(三)向量数据训练

    本文将重点介绍数据训练的流程,以及如何加载、切割、训练数据,并使用向量数据库Milvus进行数据存储。 1. 数据训练依赖于向量数据库 在本文中,我们使用了Milvus作为向量数据库。 读者可以参考之前的文章《基于GPT搭建私有知识库聊天机器人(二)环境安装》来准备其他基础环境。 2. 数据训练流程 数据训练的流程包括准备PDF文档、上传至系统文件目录、开始训练、加载文件内容、内容切割和存储至向量数据库。下面是整个流程的流程图: 3. /usr/bin/env python3 import glob import os import shutil from multiprocessing import Pool from typing 总结 在本文中,我们详细介绍了基于GPT搭建私有知识库聊天机器人的数据训练过程,包括数据训练的依赖、流程和代码展示。数据训练是搭建聊天机器人的重要步骤,希望本文能对读者有所帮助。

    1.1K40编辑于 2023-10-16
  • 来自专栏闪电gogogo的专栏

    《统计学习方法》笔记七(3) 支持向量机——非线性支持向量

    本系列笔记内容参考来源为李航《统计学习方法》 核函数定义 核技巧在支持向量机中的应用 正定核 函数K(x,z)满足正定核时可作为核函数。 常用核函数 非线性支持向量机学习算法

    61720发布于 2018-12-17
  • 来自专栏塔奇克马敲代码

    3章 字符串、向量和数组

    3.getline一遇到换行符就结束读取操作并返回结果,哪怕输入的一开始就是换行符也是如此,不过读入的换行符也还是会被丢弃。 ] = "C++"; // 自动添加表示字符串结束的空字符 const char a4[3] = {'C', '+', '+'}; // 错误 :没有空间存放空字符    3. int ia[] = {0, 1, 2, 3, 4}; auto ia2(ia); // ia2 是一个整型指针,指向 ia的第一个元素 decltype( ia) ia3; // ia3 是一个整型数组    5.

    79460发布于 2018-06-07
  • 基于 ChatGLM3 和 LangChain 搭建知识库助手

    基于 ChatGLM3 和 LangChain 搭建知识库助手 环境配置 在已完成 ChatGLM3 的部署基础上,还需要安装以下依赖包: pip install langchain==0.0.292 同时,在本节中,ChatGLM3-6B 的模型参数文件存储在本地 autodl-tmp/ZhipuAI/chatglm3-6b。 LLM Universe:一个面向小白开发者的大模型应用开发教程,旨在结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门。 注意,也可以选用其中的代码文件加入到知识库中,但需要针对代码文件格式进行额外处理。 context","question"],template=template) 最后,可以调用 LangChain 提供的检索问答链构造函数,基于我们的自定义 LLM、Prompt Template 和向量知识库来构建一个基于

    44610编辑于 2025-07-17
  • 来自专栏coder

    RAG实操教程langchain+Milvus向量数据库创建你的本地知识库

    什么是 RAG RAG 是retrieval-augmented-generation的缩写,翻译为中文的意思就检索增强,以基于最新,最准确的数据建立LLM 的语料知识库。 LLM 现存的痛点 我们知道 LLM 的知识库是通过现有的网络公开的数据作为数据源来训练的,现在公开的很多模型他们基于的训练数据会比我们现在网络上公开的数据早很多,那自然就会产生一种问题,网络上最新的数据和知识 不过虽然RAG有许多优势在,但这3种方法并不是互斥的,反而是相辅相成的。 结合 RAG 和 Fine tuning ,甚至 Promt Enginerring 可以让模型能力的层次性得增强。 保存拆分好的文档保存到向量数据库中。 设计向量数据库的数据库、集合、字段,索引等信息。 0.2, "top_p": 0.95, "stream": true }' 对比pdf中的内容,很明显这个结果就是对的: 总结: 本文主要是介绍了使用 langchain+ Milvus向量数据库构建一个知识库的示例

    4.4K11编辑于 2024-09-06
  • 来自专栏HappenLee的技术杂谈

    ClickHouse源码笔记3:函数调用的向量化实现

    分享一下笔者研读ClickHouse源码时分析函数调用的实现,重点在于分析Clickhouse查询层实现的接口,以及Clickhouse是如何利用这些接口更好的实现向量化的。 (当前ClickHouse不支持使用Explain语句来查看执行计划,这个确实是很蛋疼的~~) ClickHouse的执行PipeLine 这里分为了3个流 ExpressionBlockInputStream block.columns(); block.insert({ nullptr, result_type, result_name}); 3. 计算的最终结果 3.要点梳理 第二小节梳理完成了一整个函数调用的流程,这里重点梳理一下实现向量化函数调要点: ClickHouse的计算是纯粹函数式编程式的计算,不会改变原先的列状态,而是产生一组新的列 (这里可以打开gcc的编译flag:-fopt-info-vec或者clang的编译选项:-Rpass=loop-vectorize来查看实际源代码的向量化情况) 4.

    2.4K30发布于 2021-02-22
  • 来自专栏AI进修生

    【闭门会干货】字节 AI 最新动态:豆包升级+提示词神器+ SOTA 向量模型 + AI知识库

    最后一步,进入智能优化页面,并开启优化 等大约6-10分钟,查看优化报告: 右边第3版的提示词分数达到4.0。说明这个提示词更好。点击V3 Prompt即可复制。 这模型在能力上又升了一级,第一次能把视频也向量化了,让多模态搜索和理解更深入。在所有向量化场景里,它都称得上是最佳选择。 这样,接收者就能跟着指南,一步步、更有针对性地学习,对知识库内容的了解也更生动。 3. 可交互的深度研究。 遇到复杂问题,你能让 AI 先“做个计划”,而且这个计划的每一步,你都能精确修改。 字节的知识库向量库 VikingDB 是字节自研的高性能云原生向量数据库。 基于这个向量数据库,字节还搞了个好用的知识库产品。升级后的知识库,支持图、文、视频的多模态处理和混排输出,在国内外的评测里效果都更好了。

    1.5K10编辑于 2025-08-04
领券