首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 11-4 scikit-learn中的SVM

    a 数据的标准化 前几个小节介绍了SVM算法的理论部分,本小节主要介绍如何通过sklearn实现SVM算法。 SVM算法寻找的决策边界是通过最大化margin求得的,而margin是通过数据点之间的距离来衡量的,所以SVM算法是涉及距离计算的。 由于SVM算法涉及到距离的计算,因此为了避免结果出现偏差,在使用SVM算法之前首先要对数据进行标准化的处理。 举一个简单的小例子。 为了避免这种问题的发生,在具体使用SVM算法之前应该对所有的数据进行标准化的处理。 ? b 使用sklearn实现SVM算法 使用sklearn封装好的方法来实现SVM算法。 到目前为止,使用SVM算法进行分类都是一种线性的分类方式,但是对高度非线性的数据集,该如何使用SVM算法进行分类呢?

    1.9K20发布于 2020-07-08
  • 来自专栏华章科技

    马太效应和幂律分布是怎么回事?终于有人讲明白了

    在图11-4中,我们绘制了表11-1中的数据。注意,分布只是为整数值定义的。我们增加了一条差值线来显示总体趋势。另外注意,理论概率和经验概率并不是完全重叠。 ▲图11-4 布朗语料库中最常见的20个单词的Zipf分布 当我们发现一个快速下降的趋势时,如图11-4中的趋势,就有必要检查一下,如果我们将熟悉的x和y坐标轴替换为对数坐标轴会发生什么。 在对数坐标轴中,我们将所有值转换为它们的对数后绘制出来,图11-5给出了与图11-4等价的对数坐标图:对每个y我们使用log y,对每个x,我们使用log x。 ? 本文摘编自《真实世界的算法:初学者指南》,经出版方授权发布。 推荐语:学习算法的启蒙读本,算法尽量简单,避免读者有挫败感,仅需基本数学基础和计算机常识知识。 通过真实世界需要解决的实际问题来介绍算法思想,为各领域高效运用算法提供重要指南。

    2K11发布于 2020-08-07
  • 来自专栏CSDNToQQCode

    软考中级(软件设计师)——数据流图(DFD图下午第一题15分)(必拿题)

    信用 卡客户可以通过CCMS查询并核实其交易信息(包括信用卡交易记录及交易额)●图11-3和图11-4分别给出了该系统的顶层数据流图和0层数据流图的初稿。 11-3​​​​ 11-4 [问题1] (3分) 根据[说明], 将图11- 3中的E1 ~ E3填充完整。 (注 :数据流的起点和终点均采用图中的符号和描述) [问题3] (5分) 图11-4中有两条数据流是错误的,请指出这两条数据流的名称,并改正。 (注:数据流的起点和终点均采用图中的符号和描述) [问题4] (4分) 根据[说明], 将图11-4中P1 ~ P4的处理名称填充完整。 题目解析: 1.信用卡申请。

    4.3K21编辑于 2022-11-30
  • 来自专栏愿天堂没有BUG(公众号同名)

    如果你精通java虚拟机:新生代垃圾回收YoungGC之后,薪资不止20K

    对象复制负责将队列中的所有存活对象复制到Survivor Region或者晋升到Old Region,如代码清单11-4所示: 代码清单11-4 对象复制 template <class T> void 另外,YGC复制算法相当于做了一次堆碎片的清理工作,如整理Eden Region可能存在的碎片。

    67520编辑于 2022-10-31
  • 来自专栏技术分享

    算法】----BF算法&KMP算法

    我们今天所讨论的两个算法就是有关该过程的算法。 事实上,对于检索,无非就是两个字符串的匹配过程,模式串是你想要匹配的串,主串是你搜索所在串。 BF算法和KMP算法是较为著名的模式匹配算法,接下来作出详细介绍。 BF算法 BF算法(Brute-Force)也称为暴力算法,其核心原理是逐个比较文本串和模式串的字符,如果匹配失败,则通过向右移动模式串的位置,再次进行比较。 在实际情况下,BF算法的效率并不高,特别是当文本串T和模式串P的长度很大时。对于较长的文本串和模式串,BF算法的时间复杂度可能会导致性能问题。 答案就是KMP算法。 KMP算法 KMP算法的核心思想是利用模式串自身的特点来加速匹配过程,避免重复匹配。

    58210编辑于 2024-06-18
  • 来自专栏PPV课数据科学社区

    算法】PCA算法

    小编邀请您,先思考: 1 PCA算法的原理是什么? 2 PCA算法有什么应用?

    2K40发布于 2018-04-18
  • 来自专栏用代码征服天下

    算法——排序算法

     基本思想:现在有一个数组arr= {12,35,99,18,76},需要将其从小到大排序

    1K10编辑于 2022-05-09
  • 来自专栏华章科技

    所到之处,寸草不生!深扒黑产工具和羊毛党操作流程

    5)打码平台:这里的打码平台指利用猫池或工具自动发送和接收短信验证码并可以自动填写验证码,而一些难以识别的验证码,可以通过图形识别甚至由后台人工识别后填写,也叫“云”打码平台,如图11-4所示。 ? ▲图11-4 打码平台 6)手机模拟器、刷机软件:手机模拟器的产生本身是为了方便开发人员在没有手机的情况下,使用模拟器对程序进行开发和调试,但黑产也注意到模拟器可以模拟手机进行操作,有时候可以省下手机成本

    4.1K21发布于 2020-07-29
  • 来自专栏Super 前端

    算法--分治算法

    本文链接:https://ligang.blog.csdn.net/article/details/83866378 分治算法 分而治之,把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题 经典递归案例: 示例: 归并排序 详见:javascript排序算法 示例: 二分查找法(二分法) 二分查找也称折半查找,其要求线性表必须采用顺序存储结构,而且表中元素按关键字有序排列。

    89531发布于 2019-08-15
  • 来自专栏数据科学与人工智能

    算法】xgboost算法

    小编邀请您,先思考: 1 XGBoost和GDBT算法有什么差异? XGBoost的全称是 eXtremeGradient Boosting,2014年2月诞生的专注于梯度提升算法的机器学习函数库,作者为华盛顿大学研究机器学习的大牛——陈天奇。 xgboost问世后,因其优良的学习效果以及高效的训练速度而获得广泛的关注,并在各种算法大赛上大放光彩。 ? 具体算法如下: 输入:训练集 ? 输出:提升树 步骤: (1)初始化 (2) 对m=1,2,3……M a)计算残差 ?

    2K90发布于 2018-03-27
  • 来自专栏半生瓜のblog

    算法】查找算法

    查找算法 查找的定义 查找:又称检索或查询,是指在查找表中找出满足一定条件的结点或记录对应的操作。 查找效率:查找算法中的基本运算是通过记录的关键字与给定值进行比较,所以查找的效率通常取决于比较所花的时间,而时间取决于比较的次数。通常以关键字与给定值进行比较的记录个数的平均值来计算。 数组是特殊的块索引(一个块一个元素): [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xDbRyWBM-1635489015712)(查找算法.assets/image- [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6LawbrgF-1635489015715)(查找算法.assets/image-20211028180620292.png )] 分块查找的算法分两步进行,首先确定所查找的节点属于哪一块,即在索引表中查找其所在的块,然后在块内查找待查询的数据。

    1K20编辑于 2023-05-13
  • 来自专栏数据科学与人工智能

    算法】PCA算法

    小编邀请您,先思考: 1 PCA算法的原理是什么? 2 PCA算法有什么应用?

    1.9K60发布于 2018-03-27
  • 来自专栏数据科学与人工智能

    算法】Adaboost 算法

    小编邀请您,先思考: 1 Adaboost算法的原理是什么 ? 2 Adaboost算法如何实现? 是一个加法模型,而Adaboost算法其实是前向分步算法的特例。那么问题来了,什么是加法模型,什么又是前向分步算法呢? 3.1 加法模型和前向分步算法 如下图所示的便是一个加法模型 ? 这个优化方法便就是所谓的前向分步算法。 下面,咱们来具体看下前向分步算法算法流程: 输入:训练数据集 ? 损失函数: ? 基函数集: ? 输出:加法模型 ? 3.2 前向分步算法与Adaboost的关系 在上文第2节最后,我们说Adaboost 还有另外一种理解,即可以认为其模型是加法模型、损失函数为指数函数、学习算法为前向分步算法的二类分类学习方法。 前向分步算法逐一学习基函数的过程,与Adaboost算法逐一学习各个基本分类器的过程一致。 下面,咱们便来证明:当前向分步算法的损失函数是指数损失函数 ?

    2.6K140发布于 2018-03-27
  • 来自专栏数据科学与人工智能

    算法】SVD算法

    2 SVD算法与PCA算法有什么关联? 3 SVD算法有什么应用? 4 SVD算法如何优化? 前言 奇异值分解(Singular Value Decomposition,简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域,是很多机器学习算法的基石 本文就对SVD的原理做一个总结,并讨论在在PCA降维算法中是如何运用运用SVD的。 也可以用于推荐算法,将用户和喜好对应的矩阵做特征分解,进而得到隐含的用户需求来做推荐。同时也可以用于NLP中的算法,比如潜在语义索引(LSI)。 SVD小结 SVD作为一个很基本的算法,在很多机器学习算法中都有它的身影,特别是在现在的大数据时代,由于SVD可以实现并行化,因此更是大展身手。

    2K121发布于 2018-03-27
  • 来自专栏数据科学与人工智能

    算法】GBDT算法

    小编邀请您,先思考: 1 GBDT算法的原理是什么? 2 GBDT算法如何做正则化处理? GBDT在BAT大厂中也有广泛的应用,假如要选择3个最重要的机器学习算法的话,个人认为GBDT应该占一席之地。 分类算法 GBDT的分类算法从思想上和GBDT的回归算法没有区别,但是由于样本输出不是连续的值,而是离散的类别,导致我们无法直接从输出类别去拟合类别输出的误差。 除了负梯度计算和叶子节点的最佳残差拟合的线性搜索,二元GBDT分类和GBDT回归算法过程相同。 多元分类算法 多元GBDT要比二元GBDT复杂一些,对应的是多元逻辑回归和二元逻辑回归的复杂度差别。 由于GBDT的卓越性能,只要是研究机器学习都应该掌握这个算法,包括背后的原理和应用调参方法。目前GBDT的算法比较好的库是xgboost。当然scikit-learn也可以。

    1.6K80发布于 2018-03-27
  • 来自专栏用代码征服天下

    算法——查找算法

    1、顺序查找: 定义: 顺序查找(Sequential Search) 又叫线性查找,是最基本的查找技术,它的查找过程是:从表中第一个(或最后一个)记录开始,逐个进行记录的关键字和给定值比较,若某个记录的关键字和给定值相等,则查找成功,找到所查的记录;如果直到最后一个(或第一个)记录,其关键字和给定值比较都不等时,则表中没有所查的记录,查找不成功。 代码: import java.util.Scanner; import org.junit.jupiter.api.Test; /** * 顺序查找

    1.1K10编辑于 2022-05-09
  • 来自专栏半生瓜のblog

    算法】分治算法

    分治算法 将一个规模为N的问题分解为k个较小的子问题,这些子问题遵循的处理方式就是互相独立且与原问题相同。 两部分组成: 分(divide):递归解决较小的问题。

    66610编辑于 2023-05-13
  • 来自专栏DearXuan的博客文章

    算法基础-算法分析

    算法 什么是算法 算法是对特定问题求解步骤的一种描述,是执行的有限序列,其中每个指令都表示一个或多个操作。 这就是一种算法。 为什么要用算法 算法无处不在。 为了走出迷宫,你可能需要DFS,即深度优先搜索算法来寻找出路。 为了找到最短路径,你可能要用到A*算法来高效查找。 为了寻找一个正确的解法或者找到更优的解法,就需要用到算法。 数据结构 数据结构是一种储存数据的方式,用来提供高效的访问和修改。 算法效率 渐进时间复杂度 在一个算法中,若基本操作重复的次数可以表示为对问题规模n的函数 f(n) ,那么算法的时间度量就可以记作 T(n)=O(f(n)) 它表示随着问题规模n的增加,算法执行时间的增长率和 分治法 如果一个算法通过一次或多次调用自身来解决问题,那么这些算法就使用了分治法的思想。 分治法将一个问题划分为多个相类似但是规模更小的子问题。

    71610编辑于 2022-01-21
  • 来自专栏zxctscl个人专栏

    算法】双指针算法

    二、算法原理 用两个指针来讲数组进行划分,一个cur:从左往右扫描数组,遍历数组;一个dest:已经处理的区间内,非零元素的最后一个位置。 二、算法原理 如果用双指针从前往后遍历,就拿例1来说, 就会出现值被覆盖的情况: 所以遍历顺序就不能从前往后。 二、算法原理 用两个指针来记录容器两边的高度,可以直接先选择最大的宽度,记录下这个容积。 二、算法原理 利用数组是有序的,用双指针算法来算。 定义两个指针,一个在左边,一个在右边。 二、算法原理 排序之后,数据是有序的,这里就用双指针算法

    49100编辑于 2024-04-15
  • 来自专栏数据科学与人工智能

    算法】聚类算法

    聚类方法的分类 主要分为层次化聚类算法,划分式聚类算法,基于密度的聚类算法,基于网格的聚类算法,基于模型的聚类算法等。 算法,Neares neighbor算法等。 算法、DENCLUE算法。 但这种算法效率的提高是以聚类结果的精确性为代价的。经常与基于密度的算法结合使用。 代表算法有STING算法、CLIQUE算法、WAVE-CLUSTER算法等。 在经典聚类算法失效的情况下,核聚类算法仍能够得到正确的聚类。代表算法有SVDD算法,SVC算法

    2.2K130发布于 2018-03-27
领券