首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器学习算法工程师

    《机器学习》笔记-支持向量机(6

    章节目录 间隔与支持向量 对偶问题 核函数 软间隔与正则化 支持向量回归 核方法 1 间隔与支持向量 给定训练样本D={{x1, y1}, {x2, y2}, ... 距离超平面最近的这几个训练样本点称为“支持向量”(support vector),两个异类支持向量到超平面的距离之和为, ? 称为“间隔”(margin)。 “核函数选择”是支持向量机的最大变数。常用的核函数有, ? 此外,还可以通过函数到组合得到。 缓解该问题的一个办法是允许支持向量机在一些样本上出错。为此引入了“软间隔”(soft margin)的概念,如下图所示, ? 6 核方法 根据“表示定理”,对于一般的损失函数和正则化项(不要求是凸函数),优化问题的最优解都可表示为核函数的线性组合。这显示出核函数的巨大威力。

    86370发布于 2018-03-30
  • 来自专栏前端加油站

    ES6知识库汇总三

    3.ES6 规定,通过super调用父类的方法时,super会绑定子类的this。

    44750发布于 2019-07-02
  • 来自专栏数据和云

    YH6:Oracle Sharding 知识库

    简单来说,Oracle的Sharding技术就是通过分区(Partioning)技术的扩展来实现的。以前一个表的分区可以存在于不同的表空间,现在可以存在于不同的数据库。不同分区存在于不同数据库,这就将

    87770发布于 2018-03-07
  • 来自专栏前端加油站

    ES6知识库汇总一

    https://blog.csdn.net/j_bleach/article/details/70665221 变量声明 1.js 共计6种变量声明方式(var,let, [a,b]=[b,a]//交换a,b值 数组 1.Array.from方法用于将两类对象转为真正的数组:类似数组的对象(array-like object)和可遍历(iterable)的对象(包括ES6新增的数据结构 可在调用的时候省略参数 } fetch(‘http://example.com‘) 2.func = () => foo等于var func=function(){return foo} 3.ES6 // ES5的写法 var arr1 = [0, 1, 2]; var arr2 = [3, 4, 5]; Array.prototype.push.apply(arr1, arr2); // ES6的写法 // ES5 a = list[0], rest = list.slice(1) // ES6 [a, ...rest] = list 6.函数体内的this对象,就是定义时所在的对象,而不是使用时所在的对象

    57250发布于 2019-07-02
  • 来自专栏叶子的开发者社区

    向量6(继承)栈操作 C++

    定义CStack类实现栈操作。CStack类继承CVector类,新增私有数据成员:

    31110编辑于 2023-07-30
  • 来自专栏前端加油站

    ES6知识库汇总二

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/j_bleach/article/details/70761711

    46820发布于 2019-07-02
  • 来自专栏陶士涵的菜地

    客服系统个性化训练GPT知识库+知识库列表中新增向量搜索功能+语义文本搜索

    大家都知道想要实现个性化训练的GPT,离不开向量数据库。 在我的客服系统后台,能够展示出向量库里的数据列表。现在有一个新需求,客户添加的数据很多,想要能够在后台搜索指定的数据,方便去修改。 新增搜索功能后,后台界面展示如下: 搜索部分也是基于的Qdrant数据库的search 接口,该接口需要把搜索的文本转成向量后,再通过向量去搜索相关数据。 所以,还是需要调用下gpt的 /v1/embeddings ,把搜索的关键词转为向量。 拿到向量再去调用qdrant数据库的  /collections/集合/points/search ,就可以把关键词通过语义文本相似性搜索出相关的数据 看看下面的效果,我胡乱写的搜索关键词,正常的分词搜索是搜不出数据的 ,现在通过向量搜索就能搜出来了

    44320编辑于 2023-07-21
  • 来自专栏陶士涵的菜地

    开发GPT知识库功能时,需要上传word文档让知识库向量化,Golang读取word文档功能

    开发GPT知识库功能时,需要上传word文档让知识库向量化,Golang读取word文档功能。

    1.1K10编辑于 2023-04-21
  • 来自专栏音视频技术学习笔记

    机器学习作业6-支持向量

    这一节课有一定难度,支持向量机单独拿出来讲,都可以写一本书。但是题目实现的比较简单,有成熟的库大大降低了实现的难度。 这一章看了两遍了,还查阅了不少资料,值得多看几遍 线性回归 神经网络 支持向量机 总共三道题 线性SVM 带高斯内核的SVM 搜索最佳参数 实现垃圾邮件识别过滤 源码实现的比较详细,欠缺的是没有画出决策边界 原始数据 c=1 c=100 第二道题 原始数据 c=1 image.png 支持向量机参考资料 ---- 为什么叫“支持向量机” https://www.zhihu.com/question /59621954 ---- 支持向量机是什么意思 https://www.zhihu.com/question/21094489 英文原文: http://bytesizebio.net/2014 /02/05/support-vector-machines-explained-well/ ---- 支持向量机的三重境界 https://blog.csdn.net/v_july_v/article

    39320发布于 2021-03-16
  • 来自专栏AILearning

    【机器学习实战】第6章 支持向量

    6章 支持向量机 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js? config=default"></script> 支持向量机 概述 支持向量机(Support Vector Machines, SVM):是一种机器学习算法。 SMO 伪代码大致如下: 创建一个 alpha 向量并将其初始化为0向量 当迭代次数小于最大迭代次数时(外循环) 对数据集中的每个数据向量(内循环): 如果该数据向量可以被优化 随机选择另外一个数据向量 同时优化这两个向量 如果两个向量都不能被优化,退出内循环 如果所有向量都没被优化,增加迭代数目 所以:我们可以考虑使用支持向量机,保留支持向量就行(knn需要保留所有的向量),就可以获得非常好的效果。

    1.2K80发布于 2017-12-29
  • 向量检索+NLU:AI知识库高效检索的核心逻辑与实操

    而语义化AI问答和向量检索式AI搜索,则从根本上解决了传统知识库的关键词检索瓶颈,传统基于倒排索引的搜索方式常出现“搜不到”“搜不准”的情况,比如查询“如何解决HTTP接口调用超时的服务端问题”,关键词搜索仅能返回含 “超时”的零散文档,而系统的AI搜索通过自然语言理解(NLU) 解析用户查询意图,结合知识库的内容向量库做精准匹配,AI问答还能基于知识库语料做上下文关联推理,直接给出结构化的解决方案,无需再逐篇翻找整合信息 实操中还可利用其批量离线文件导入接口,将过往散落的Word、PDF、MD格式文档一次性批量迁入知识库,结合系统的内容结构化解析能力完成文档格式归一化,大幅降低知识库初期的内容迁移成本。 系统的第三方体系无缝集成能力依托轻量化的API接口与WebHook机制实现,让知识库的使用场景得到无限延伸,这也是我在团队落地时最看重的特性。 我们团队日常基于飞书做协同办公,通过调用系统的机器人开发接口,快速实现飞书智能问答机器人的开发与部署,同事在飞书群内通过@机器人即可发起知识库查询,无需跨平台操作;同时将知识库的网页挂件组件嵌入公司官网产品板块

    22510编辑于 2026-02-28
  • 来自专栏程序员树先生

    基于 ChatGLM-6B 搭建个人专属知识库

    ChatGLM-6B 部署与 P-Tuning 微调实战 今天树先生教大家无需微调就能实现垂直领域的专业问答,利用 ChatGLM-6B + langchain 实现个人专属知识库,非常简单易上手。 技术原理 项目实现原理如下图所示,过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 -> 匹配出的文本作为上下文和问题一起添加到 从上面就能看出,其核心技术就是向量 embedding,将用户知识库内容经过 embedding 存入向量知识库,然后用户每一次提问也会经过 embedding,利用向量相关性算法(例如余弦算法)找到最匹配的几个知识库片段 ChatGPT 引爆向量数据库赛道 使用场景 可以调整 prompt,匹配不同的知识库,让 LLM 扮演不同的角色 上传公司财报,充当财务分析师 上传客服聊天记录,充当智能客服 上传经典Case,充当律师助手 -qe": "THUDM/chatglm-6b-int4-qe", "chatglm-6b-int4": "THUDM/chatglm-6b-int4", "chatglm-6b-int8

    4.3K155编辑于 2023-05-16
  • 来自专栏机器学习算法与Python学习

    支持向量机之最小二乘(LS)-------6

    上次了解了核函数与损失函数之后,支持向量机的理论已经基本完成,今天将谈论一种数学优化技术------最小二乘法(Least Squares, LS)。 说了这么多,貌似跟本文的主题支持向量机没啥关系呀,别急,请让我继续阐述。本质上说,最小二乘法即是一种参数估计方法,说到参数估计,咱们得从一元线性模型说起。 什么是一元线性模型呢? 先来梳理下几个基本概念: (1) 监督学习中,如果预测的变量是离散的,我们称其为分类(如决策树,支持向量机等),如果预测的变量是连续的,我们称其为回归。 上面仅仅给出了SMO算法的最终求解公式,并未给出具体的求解过程,这个内容将在明天给出,也是关于支持向量机基本理论的最后一点内容~~~~

    3.5K90发布于 2018-04-04
  • 来自专栏机器学习与统计学

    【R语言经典实例6】对整个向量执行计算

    解决方案 基本的数学运算符可以对向量中的元素进行逐个计算。许多其他的函数也能对向量元素逐个进行运算,并以向量的形式输出结果。 讨论 向量计算是R软件的一大特色。所有的基本数学运算符都能应用于向量对中。 原因是结果向量中的每个元素都是由原向量对中对应的两个元素计算得来。 若使一个向量与一个常数进行运算,则会将该向量的每个元素与常数进行运算: > w [1] 1 2 3 4 5 > w + 2 [1] 3 4 5 6 7 > w - 2 [1] -1 0 1 2 3 > w * 2 [1] 2 4 6 8 10 > w / 2 [1] 0.5 1.0 1.5 2.0 2.5 > w ^ 2 [1] 1 4 9 16 25 > 2 ^ w [1] 还有许多函数对整个向量进行运算。

    1.4K30发布于 2019-04-10
  • 来自专栏人工智能与演化计算成长与进阶

    12支持向量6SVM总结

    直接使用 SVM 软件包 里面都内置了多类分类的功能 或使用一对多的方法,如果有 K 个类,就需要 K 个二分类模型,把每一类从其他类中分出来,即每个模型都把原始样本分为两类 目标类-其他类 逻辑回归和支持向量机 从逻辑回归模型,我们得到了支持向量机模型,在两者之间,我们应该如何选择? 如果 n 较小,而且 m 大小中等,例如 n 在 1-1000 之间,而 m 在 10-10000 之间,使用高斯核函数的支持向量机。 如果 n 较小,而 m 较大,例如 n 在 1-1000 之间,而 m 大于 50000,则使用支持向量机会非常慢,解决方案是创造、增加更多的特征,然后使用逻辑回归或不带核函数的支持向量机。 神经网络和支持向量机 值得一提的是,神经网络在以上三种情况下都可能会有较好的表现,但是训练神经网络可能 非常慢(这是 2014 年的教程,所以现在 NG 当然不会这么说) ,而且容易陷入局部最优解,选择支持向量机的原因主要在于它的代价函数是凸函数

    47710发布于 2020-08-14
  • 来自专栏程序员树先生

    LangChain + ChatGLM2-6B 搭建个人专属知识库

    之前教过大家利用 langchain + ChatGLM-6B 实现个人专属知识库,非常简单易上手。 bash web_demo.sh结果对比原始模型微调后模型LangChain + ChatGLM2-6B 构建知识库LangChain 知识库技术原理目前市面上绝大部分知识库都是 LangChain + LLM + embedding 这一套,实现原理如下图所示,过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 从上面就能看出,其核心技术就是向量 embedding,将用户知识库内容经过 embedding 存入向量知识库,然后用户每一次提问也会经过 embedding,利用向量相关性算法(例如余弦算法)找到最匹配的几个知识库片段 模型配置上传知识库基于 ChatGLM2-6B 的知识库问答定制 UI由于 LangChain 项目更新了接口,树先生之前开发的定制 UI 也同步更新进行了适配。

    6.4K53编辑于 2023-07-14
  • 避雷:搭建AI知识库6大注意事项

    但是,在搭建AI知识库的过程中,稍不留意,就会漏掉一些小细节,导致做出来的AI知识库没有发挥最大的作用。一起来看看搭建AI知识库时需要注意的几个关键点,帮你避开容易踩的坑。 第一个是明确目标和需求。 在搭建AI知识库之前,要先明确AI知识库的目的是什么。是提升客户服务质量、优化内部工作流程,还是进行大数据分析?只有一开始就明确了目标,才能确保知识库搭建方向正确,避免走弯路,浪费时间。 数据是AI知识库的重要部分。收集到的数据需要是准确、完整的。如果数据存在错误或遗漏,那么基于这些数据搭建的AI知识库就会无法提供准确的信息给到用户,那么这个AI知识库无异于一个失败的知识库。 第四个是知识库的更新和维护。 随着企业业务的不断变化和发展,AI知识库的内容也要实时更新和修改,让用户在第一时间接收到最新的信息,增加用户的良好体验感。 在开始使用某产品的AI知识库之前,数据安全和隐私保护是用户首要关心的一个重要问题。在搭建AI知识库时,要采取必要的安全措施来保护用户数据和知识库本身的安全。

    86810编辑于 2024-09-24
  • Yi-6B-Chat 接入 LangChain 搭建知识库助手

    Yi-6B-Chat 接入 LangChain 搭建知识库助手 环境准备 在 autodl 平台中租赁一个 3090 等 24G 显存的显卡机器,如下图所示镜像选择 PyTorch–>2.0.0–>3.8 scipy transformers_stream_generator==0.0.4 peft deepspeed pip install -U huggingface_hub 模型下载 在已完成 Yi-6B-chat ', cache_dir='/root/autodl-tmp', revision='master') 知识库建设 我们选用以下开源仓库作为知识库来源: sweettalk-django4.2 首先我们需要将上述远程开源仓库 注意,也可以选用其中的代码文件加入到知识库中,但需要针对代码文件格式进行额外处理。 context","question"],template=template) 最后,可以调用 LangChain 提供的检索问答链构造函数,基于我们的自定义 LLM、Prompt Template 和向量知识库来构建一个基于

    28210编辑于 2025-07-17
  • 来自专栏YO大数据

    【AI大模型】Embedding模型解析 文本向量知识库的构建和相似度检索

    是将文字或短语转换成数值向量的过程。这些向量捕捉了单词的语义特征,例如意义、上下文关系等。 当我们使用向量化模型(如OpenAI的text-embedding-ada-002模型)将文本转化为向量后,每个向量的维度表示某种语义特征,向量中的值反映了相应特征的强度。 | 分别是这两个向量的欧几里得范数(即向量的长度)。 这个比例的本质是测量两个向量之间夹角的余弦值,范围从-1到1: 当余弦值为1时,表示两个向量方向完全相同。 当余弦值为0时,表示两个向量正交,即在高维空间中不相关。 后续会使用到向量数据库 完成知识库的搭建 欢迎小伙伴们 点赞、收藏⭐、留言 有问题可以咨询主页

    14.5K21编辑于 2024-05-25
  • 向量检索与NLP赋能:开源知识库的技术核心与应用场景

    此类AI大模型驱动的开源知识库系统,基于AGPL-3.0开源协议开发,依托大模型微调适配、向量数据库检索、RESTful API接口等核心技术,凭借智能化功能、灵活的拓展能力与轻量化的部署体验,为不同组织框架下的企业知识管理提供了全新的解决方案 在知识架构搭建上,该开源知识库支持结构化与轻量化并存的知识体系搭建模式,基于树形目录结构、标签化分类体系、向量嵌入索引,可根据企业组织框架的层级关系,搭建从企业级、部门级到岗位级的层级化知识目录,也可根据业务场景搭建轻量化的专题知识空间 (四)AI检索与问答:实现组织内的“知识找人”传统关键词检索模式往往存在“检索结果与需求匹配度低”的问题,而此类开源知识库的AI语义检索基于向量数据库(如Milvus、Chroma)、BERT语义模型, 针对集团型企业跨子公司、跨部门的知识查询需求,AI可通过跨库向量检索、分布式查询,打破组织边界,整合全集团的相关知识;针对事业部制企业各业务线的专业知识查询需求,AI可通过领域知识库微调,精准匹配业务线专属知识 (三)事业部制框架下的落地成效该企业的使用数据显示,部署该开源知识库后,基于向量检索的高效性,跨事业部知识查询的平均时间从原来的20分钟缩短至1分钟内,研发、生产、售后三大事业部的协作效率提升70%;生产事业部的工艺失误率因精准获取研发资料下降

    22410编辑于 2026-03-11
领券