首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器学习/数据可视化

    机器学习实战-4-KNN算法总结

    机器学习实战-4-KNN算法总结 在前两篇文章机器学习实战-2-KNN和机器学习实战-3-基于KNN的约会网站配对实现中结合实际案例详细讲解了KNN算法的知识,主要包含: 算法的原理及概述 算法的主要步骤 图解KNN算法 如何建立KNN分类 电影分类和约会网站配对案例 还有其他的内容,比如KNN算法中使用的欧式距离涉及到的机器学习中的度量问题、jupyter notebook中如何使用KNN算法等。 "].tolist()}) # 3、根据距离升序排列,取出前k个 dist_sorted = dist_labels.sort_values(by="dist")[:k] # 4、 空间复杂度高,从而导致计算量大 如果数值多不适合,计算量过大 可解释性差,不能给出数据的内在含义 样本不平衡问题:有些类别的样本多,有些类别的样本数量较少 参考资料 1、《机器学习实战》一书 2、李航老师 :《统计学习方法》 3、机器学习实战教程(一):K-近邻算法(史诗级干货长文)

    80210发布于 2021-03-03
  • 来自专栏人工智能的秘密

    4种普遍的机器学习分类算法

    本文主要介绍了 4 种应用比较普遍的的机器学习算法,但是机器学习算法还有其他很多不同的算法,大家感兴趣的可以自己去了解。 4.如果 ,则 。 朴素贝叶斯算法在执行文本分类等工作是会有很好的效果,比如朴素贝叶斯算法常被使用于垃圾邮件的过滤分类中。 SVM 算法虽然存在难以训练和难以解释的问题,但是在非线性可分问题上的表现十分优秀,在非线性可分问题中常选择 SVM 算法。 基于 KNN 的算法 K - 近邻算法,简称 KNN(k-Nearest Neighbor),它同样是一个比较简单的分类、预测算法。 KNN 算法相比其他算法也更加简单,并且易于理解、实现,无需估计参数与训练。适合对稀有事件进行分类和多分类方面的问题,在这类问题方面 KNN 算法的表现比 SVM 更好。

    1.5K00发布于 2017-12-25
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 4-1 k近邻算法基础

    本系列是《玩转机器学习教程》一个整理的视频笔记。本小节主要介绍K近邻算法。 ? K近邻算法 k近邻算法机器学习中最简单的算法之一,他是入门机器学习中的第一个算法。 K近邻算法: 思想极度简单; 应用数学知识少(近乎为零); 效果比较好; 可以解释机器学习算法使用过程中很多细节问题 更完整的刻画机器学习应用流程 ? 如果使用K近邻算法,我们需要给定一个K值,K值是一个超参数,由我们根据经验自己指定,此时我们给定k = 3。 ? 预测新的数据点 K近邻要做的就是假设有了一个新的数据x,我们需要通过k近邻算法知道新的数据点x属于哪一个类别。也就是说,他最有可能是良性肿瘤还是恶性肿瘤。 ? 根据K近邻算法,从图中直观来看,蓝色数据点也就是新的数据点属于红色点也就是恶性肿瘤的概率大一些。接下来就使用K近邻算法来预测这个蓝色数据点类别。 ?

    56710发布于 2019-11-12
  • 来自专栏SuperFeng

    机器学习系列 4:线性回归的梯度下降算法

    之前我们已经学过了线性回归、代价函数和梯度下降,但是他们就像一个人的胳膊和腿,只有组合在一起才会成为一个「完整的人」,这个「完整的人」就是一个机器学习算法,让我们一起来学习第一个机器学习算法吧。 这个机器学习算法叫做线性回归的梯度下降算法(Gradient Descent For Linear Regression),还记得我们学过的线性回归函数、代价函数和梯度下降算法吗? 带入梯度下降算法中,得到: ? 这个算法也叫做「Batch」梯度下降(「Batch」 Gradient Descent ),他的特点就是每次进行梯度下降都要使用整个数据集。 恭喜你,到目前为止你已经学会了第一个机器学习算法!这个算法在解决线性回归问题中十分好用。你已经成功地在通往机器学习的道路上迈出一小步了。

    57210发布于 2019-09-26
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 9-4 实现逻辑回归算法

    全文字数:864字 阅读时间:8分钟 前言 本系列是《玩转机器学习教程》一个整理的视频笔记。本小节主要依据sklearn的设计理念封装我们自己的逻辑回归算法,最后在jupyter中调用并实现。 a 实 现 逻 辑 回 归 算 法 在之前的小节中详细推导了逻辑回归算法的损失函数。 由于逻辑回归算法没有解析解,只能通过梯度下降算法更新迭代求解,因此我们又详细推导了损失函数相应的梯度向量以及向量化的梯度表达式。 通过之前的学习我们知道逻辑回归算法和线性回归算法有很多相似之处,我们完全可以在原来实现的LinearRegression基础上修改成LogisticRegression。 接下来就具体的实现我们自己的逻辑回归算法: 导入相应的模块 由于逻辑回归算法解决的是分类问题,所以通过accuracy_score准确率来评估模型的好坏。

    82920发布于 2020-02-26
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 4-2 scikit-learn中的机器学习算法封装

    本系列是《玩转机器学习教程》一个整理的视频笔记。本小节主要介绍使用sklearn实现KNN算法。 使用sklearn实现KNN 机器学习的流程如下: ? 我们将大量的学习资料喂给机器学习算法,这个机器学习算法就会相应的训练出一个模型,之后来了一个新的输入样例之后,将这个输入样例送给这个模型,这个模型就能预测出这个新的输入样例的预测结果。 ? 在监督机器学习中输入的大量学习资料就是训练样本以及对应的标签; 机器学习算法得到训练模型过程我们称之为拟合,英文为fit; 输入样例输入模型,模型输出结果的过程叫做预测,英文为predict。 因此对于k近邻算法来说: k近邻算法是非常特殊的,可以被认为是没有模型的算法; 为了和其他算法统一,可以认为训练数据集就是模型本身,在sklearn中实现kNN就是使用的这种设计方式,就是为了和其他算法进行统一

    1.1K00发布于 2019-11-13
  • 来自专栏机器学习初学者精选文章

    机器学习基础】数学推导+纯Python实现机器学习算法4:决策树之ID3算法

    Python机器学习算法实现 Author:louwill 作为机器学习中的一大类模型,树模型一直以来都颇受学界和业界的重视。 传统的经典决策树算法包括ID3算法、C4.5算法以及GBDT的基分类器CART算法。 三大经典决策树算法最主要的区别在于其特征选择准则的不同。 ID3算法理论 所以这里的关键在于如何选择最优特征对数据集进行划分。答案就是前面提到的信息增益、信息增益比和Gini指数。 以上就是ID3算法的核心理论部分,至于如何基于ID3构造决策树,我们在代码实例中来看。 ID3算法实现 先读入示例数据集: ? 以上便是ID3算法的手写过程。

    1.1K30发布于 2020-06-21
  • 来自专栏修也的进阶日记

    算法手记4

    解题代码: 本题解题代码如下: class Solution { public: int vis[101][101]={0};//标记这个位置是否被用过 int dx[4]={0,0,1 ,-1}; int dy[4]={1,-1,0,0}; bool exist(vector<string>& board, string word) { word.size()-1) return true; //进入这个位置就把这个位置锁住 vis[x][y] = 1; //如果递归的是中间字符,继续搜索4个方位有没有符合下一个的 ,如果有,继续递归搜 for(int i=0; i<4; i++) { int a = x+dx[i],b=y+dy[i]; 如果四个位置找完没有符合下一个字符的,那么释放本位置的锁,返回false vis[x][y]=0; return false; } }; 结语 说点啥好呢...牵扯二维的算法就有点难了

    17310编辑于 2025-03-15
  • 来自专栏云深之无迹

    Python算法.4

    Python算法.3 Python 算法.2 Python算法.1 colors=['black','white'] sizes=['S','M','L'] tshirts=[(color,size print("A:%2d B:%2d C:%2d" % (a, b, c), end='') i += 1 if i % 4 # 求阶乘 def fact(n): if n==1: return 1 return n*fact(n-1) fact(4) def fib(n): if n

    37950发布于 2021-07-23
  • 来自专栏数据科学与人工智能

    算法】基础机器学习算法

    笔者邀请您,先思考: 1 您熟悉那些学习算法? 2 您应用那些机器学习算法? 本篇内容主要是面向机器学习初学者,介绍常见的机器学习算法,当然,欢迎同行交流。 ? 哲学要回答的基本问题是从哪里来、我是谁、到哪里去,寻找答案的过程或许可以借鉴机器学习的套路:组织数据->挖掘知识->预测未来。 本篇重点是机器学习算法的介绍,可以分为监督学习和无监督学习两大类。 ? 无监督学习算法很多,最近几年业界比较关注主题模型,LSA->PLSA->LDA为主题模型三个发展阶段的典型算法,它们主要是建模假设条件上存在差异。 介绍了这么多机器学习基础算法,说一说评价模型优劣的基本准则。

    58240发布于 2018-07-30
  • 来自专栏国产程序员

    垃圾回收算法(4)-复制算法

    算法原理 复制算法首先将或者的内存空间分为2块,每次只使用其中一块,在垃圾会搜时将正在使用的内存中的存活对象复 制到未被使用的内存块中,之后清楚正在使用的内存块中的所有对象,交换2个内存的角色,最后完成垃圾回收 因为年轻代中的对象基本都是朝生夕死的(80%以上),所以在年轻代的垃圾回收算法使用的是复制算法,复制算法的基本思想就是将内存分为两块,每次只用其中一块,当这一块内存用完,就将还活着的对象复制到另外一块上面 复制算法不会产生内存碎片。 在GC开始的时候,对象只会存在于Eden区和名为“From”的Survivor区,Survivor区“To”是空的。 image 存在问题 由于JVM中的绝大多数对象都是瞬时状态的,生命周期非常短暂,所以复制算法被广泛应用于年轻代中。 不过在垃圾收集技术中,复制算法提高效率的代价是认为的将可用内存缩小了一半。 个人博客 简书 掘金 CSDN OSCHINA

    91420发布于 2020-07-22
  • 来自专栏生信小驿站

    机器学习算法

    机器学习算法 广泛地说,有三种类型的机器学习算法。 1.监督学习 这个算法由一个目标/结果变量(或因变量)组成,这个变量可以从一组给定的预测变量(独立变量)中预测出来。 2.无监督学习 在这个算法中,我们没有任何目标或结果变量来预测/估计。 用于不同群体的群体聚类,广泛用于不同群体的消费者细分进行具体干预。 无监督学习的例子:Apriori算法,K-means。 3.强化学习: 使用这种算法机器被训练做出特定的决定。 它是这样工作的:机器暴露在一个环境中,它使用反复试验不断地训练自己。 这台机器从过去的经验中学习,并试图捕捉最好的知识,做出准确的业务决策。 强化学习实例:马尔可夫决策过程 这里是常用的机器学习算法列表。 这些算法可以应用于几乎所有的数据问题: 线性回归 Logistic回归 决策树 SVM 朴素贝叶斯 KNN K均值 随机森林 维度降低算法 梯度提升算法 GBM XGBoost

    49120发布于 2018-08-27
  • 来自专栏数据科学与人工智能

    机器学习】机器学习算法之旅

    在理解了我们需要解决的机器学习问题之后,我们可以思考一下我们需要收集什么数据以及我们可以用什么算法。本文我们会过一遍最流行的机器学习算法,大致了解哪些方法可用,很有帮助。 机器学习领域有很多算法,然后每种算法又有很多延伸,所以对于一个特定问题,如何确定一个正确的算法是很困难的。本文中我想给你们两种方法来归纳在现实中会遇到的算法。 增强学习多半还是用在机器人控制和其他控制系统的开发上。 算法相似性 算法基本上从功能或者形式上来分类。比如,基于树的算法,神经网络算法。这是一个很有用的分类方式,但并不完美。 正如机器学习算法本身没有完美的模型一样,算法的分类方法也没有完美的。 在这一部分我列出了我认为最直观的方法归类的算法。我并没有穷尽算法或者分类方法,但是我想对于让读者有一个大致了解很有帮助。 其他资源 这趟机器学习算法之旅意在让你对有什么算法和关联算法的一些工具给你一个总体了解。 下面是一些其他资源, 请不要觉得太多,了解越多算法对你越有好处,但是对某些算法有深层次的了解也会很有用。

    97790发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    机器学习】机器学习算法之旅

    在理解了我们需要解决的机器学习问题之后,我们可以思考一下我们需要收集什么数据以及我们可以用什么算法。本文我们会过一遍最流行的机器学习算法,大致了解哪些方法可用,很有帮助。 机器学习领域有很多算法,然后每种算法又有很多延伸,所以对于一个特定问题,如何确定一个正确的算法是很困难的。本文中我想给你们两种方法来归纳在现实中会遇到的算法。 增强学习多半还是用在机器人控制和其他控制系统的开发上。 算法相似性 算法基本上从功能或者形式上来分类。比如,基于树的算法,神经网络算法。这是一个很有用的分类方式,但并不完美。 正如机器学习算法本身没有完美的模型一样,算法的分类方法也没有完美的。 在这一部分我列出了我认为最直观的方法归类的算法。我并没有穷尽算法或者分类方法,但是我想对于让读者有一个大致了解很有帮助。 其他资源 这趟机器学习算法之旅意在让你对有什么算法和关联算法的一些工具给你一个总体了解。 下面是一些其他资源, 请不要觉得太多,了解越多算法对你越有好处,但是对某些算法有深层次的了解也会很有用。

    934100发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    机器学习】机器学习算法总结

    毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。    阿里的算法岗位很大一部分也是搞机器学习相关的。   下面是本人在找机器学习岗位工作时,总结的常见机器学习算法(主要是一些常规分类器)大概流程和主要思想,希望对大家找机器学习岗位时有点帮助。 KNN算法的优点:   1. 思想简单,理论成熟,既可以用来做分类也可以用来做回归;   2. 可用于非线性分类;   3. 训练时间复杂度为O(n);   4. 4. 循环步骤1,2,3来继续训练多个分类器,只是其D值不同而已。    它在被提出之初就和SVM一起被认为是泛化能力(generalization)较强的算法。近些年更因为被用于搜索排序的机器学习模型而引起大家关注。   GBDT是回归树,不是分类树。

    1.4K50发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    机器学习】机器学习算法预览

    在这篇文章中,我要带大家预览一下机器学习中最热门的算法。预览主要的机器学习算法可在某种程度上给你这样的一种感觉,让你知道什么样的方法是可靠的。 回归算法 我们一般认为回归算法是在变量之间存在相互关系进行建模的算法,而且通过使用在预测值产生的误差的测量标准来使用模型进行迭代提炼。 回归方法相当于统计学的机器,它与统计机器学习关联了起来。 最热门的实例算法如下: 1.k-最邻近 2.学习矢量量化(LQV) 3.自组织图(SOM) 4.局部加权学习(LWL) ? 怎样学习机器学习算法 算法机器学习的一个大模块。这个话题我是很有兴趣的,而且之前也写了很多这方面的博客。 如何运行这些机器学习算法 有时,你需要的只是一些代码。下面这些链接可以让你明白如何运行机器学习算法,并使用常规的库来编写这些代码或者从研究者运用它们。

    1.2K50发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    算法】Python实现机器学习算法

    在 Kaggle 最新发布的全球数据科学/机器学习现状报告中,来自 50 多个国家的 16000 多位从业者纷纷向新手们推荐 Python 语言,用以学习机器学习。 ? 那么,用Python实现出来的机器学习算法都是什么样子呢? 营长刚好在 GitHub 上发现了东南大学研究生“Lawlite”的一个项目——机器学习算法的Python实现,下面从线性回归到反向传播算法、从SVM到K-means聚类算法,咱们一一来分析其中的Python 目录 一、线性回归 1、代价函数 2、梯度下降算法 3、均值归一化 4、最终运行结果 5、使用scikit-learn库中的线性模型实现 二、逻辑回归 1、代价函数 2、梯度 3、正则化 4、S型函数( 聚类算法 1、聚类过程 2、目标函数 3、聚类中心的选择 4、聚类个数K的选择 5、应用——图片压缩 6、使用scikit-learn库中的线性模型实现聚类 7、运行结果 六、PCA主成分分析(降维)

    2.1K80发布于 2018-04-18
  • 来自专栏GiantPandaCV

    机器学习算法之PCA算法

    前言 在机器学习中降维是我们经常需要用到的算法,在降维的众多方法中PCA无疑是最经典的机器学习算法之一,最近准备撸一个人脸识别算法,也会频繁用到PCA,本文就带着大家一起来学习PCA算法。 前置内容 要学会PCA算法,首先需要了解矩阵分解算法。而矩阵分解算法又分为特征值分解和SVD(奇异值)分解,这两个算法的目的都是提取出一个矩阵最重要的特征。 ,整个算法的开销就过大了。 PCA算法 PCA即(Principal Component Analysis)主成分分析算法,是机器学习种应用得最广泛的数据降维算法4)对特征值从大到小排序,选择其中最大的k个。然后将其对应的k个特征向量分别作为行向量组成特征向量矩阵P。 5)将数据转换到k个特征向量构建的新空间中,即Y=PX。

    1.7K30发布于 2019-12-04
  • 4种回收算法

    (先不清理,先移动再清理回收对象) 优点: 不产生空间碎片:将所有存活对象整理到一端,边界以外被清理掉 缺点: 效率低:标记-整理算法是在标记-清除算法的基础上,又进行了对象的移动,因此成本更高 复制算法(Copying): 复制算法:将可用内存分为大小相等两块,每次只使用其中一块,当该内存使用完后,就将该内存中活着的对象复制到另一块内存;然后再将已使用过得内存一次性清理 这样每次都是对一块内存进行回收 ,如果存活对象很多,那么复制算法的效率将会大大降低。   ,再根据不同的算法进行回收。 3、当对象寿命超过阈值时,会晋升至老年代,最大寿命是15(4bit) 4、当老年代空间不足,会先尝试触发 minor gc,如果之后空间仍不足,那么触发 full gc,STW(stop the

    25710编辑于 2024-03-20
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 4-4 分类精度

    本系列是《玩转机器学习教程》一个整理的视频笔记。本小节主要介绍kNN算法的分类精度以及在sklearn中的实现。 分类精度 ? 通过上一小节的介绍,我们使用Train_Test_Split方法将这个数据集划分为训练集和测试集,通过训练集训练得到机器学习模型,之后通过测试集评测模型的效果。

    92500发布于 2019-11-13
领券