搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏foochane
KNN算法
综述 Cover和Hart在1968年提出了最初的邻近算法分类(classification)算法输入基于实例的学习(instance-based learning), 懒惰学习(lazy learning 算法详述 2.1 步骤：为了判断未知实例的类别，以所有已知类别的实例作为参照选择参数K,对任意一个未知实例选取最近的K个已知实例进行归类，通常K的值不会太大，选取1,3,5,7等等的奇数计算未知实例与所有已知实例的距离 4.1 步骤一：建立平面坐标，将7部电影转化为7个坐标，X坐标，X坐标及类型如如下图所示，通过A~F点，估计G点的类型。 ? 118.92854997854805 4.3 步骤三：估计比较以上的计算出的6个欧氏距离，选取最近的3个距离对应的点A,B,C三个点，由于这三个点都属于Romance类型，则未知数据G点根据最近邻规则分类（KNN 所以KNN算法对于K的选择非诚敏感，K=1时，不能够防止噪音，通常会增大K，以增加对噪音的健壮性 5.1 算法优点简单易于理解容易实现通过对K的选择可具备丢噪音数据的健壮性 5.2 算法缺点需要大量空间储存所有已知实例
91920发布于 2019-05-23
来自专栏常用算法专栏
KNN算法
KNN（K-Nearest Neighbors）算法是一种基本且常用的监督学习算法，它既可以用于分类问题，也可以用于回归问题。不过，KNN在分类问题中更为常见。以下是KNN算法的主要步骤和概念：定义K值： K值表示在预测时，我们考虑的“邻居”的数量。选择合适的K值很重要，过小的K值可能导致过拟合，而过大的K值可能导致欠拟合。训练过程： KNN算法没有显式的训练过程，因为它不学习任何参数或模型。相反，它存储整个训练数据集。预测过程：对于一个新的数据点，KNN算法会计算它与训练数据集中所有点之间的距离。优点： KNN算法简单易懂，易于实现。它不需要训练过程，因此可以快速地进行预测。 KNN可以处理多分类问题。缺点： KNN对训练数据的规模很敏感，当训练数据很大时，计算距离可能会非常耗时。 KNN需要存储整个训练数据集，因此空间复杂度较高。 KNN对特征的尺度敏感，需要进行特征缩放。 K值的选择对模型性能有很大影响，而确定最优的K值通常需要额外的计算。
49500编辑于 2025-04-05
来自专栏python3
深入浅出KNN算法（一） KNN算法原理
一.KNN算法概述 KNN可以说是最简单的分类算法之一，同时，它也是最常用的分类算法之一，注意KNN算法是有监督学习中的分类算法，它看起来和另一个机器学习算法Kmeans有点像（Kmeans是无监督学习算法那么什么是KNN算法呢，接下来我们就来介绍介绍吧。二.KNN算法介绍 KNN的全称是K Nearest Neighbors，意思是K个最近的邻居，从这个名字我们就能看出一些KNN算法的蛛丝马迹了。 KNN算法的优势和劣势了解KNN算法的优势和劣势，可以帮助我们在选择学习算法的时候做出更加明智的决定。那我们就来看看KNN算法都有哪些优势以及其缺陷所在！ KNN算法优点简单易用，相比其他算法，KNN算是比较简洁明了的算法。即使没有很高的数学基础也能搞清楚它的原理。模型训练时间快，上面说到KNN算法是惰性的，这里也就不再过多讲述。预测效果好。简单得说，当需要使用分类算法，且数据比较大的时候就可以尝试使用KNN算法进行分类了。 OK，本次先对KNN算法做一个介绍，下一节解析sklearn的参数，以及K值选取。
14.7K30发布于 2020-01-16
来自专栏算法工程师的学习日志
数据挖掘算法-KNN算法
算法简介邻近算法，又叫K近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。个人感觉KNN算法(K-NearestNeighbor)一种极其简单粗暴的分类方法，举一个例子，比如说你想知道一个人是不是喜欢打游戏，就可以观察他最亲密的几个朋友是不是都喜欢打游戏，如果大多数都喜欢打游戏 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。 kNN方法在类别决策时，只与极少量的相邻样本有关。 KNN算法实现鸢尾花数据集 Iris 鸢尾花数据集内包含 3 类分别为山鸢尾（Iris-setosa）、变色鸢尾（Iris-versicolor）和维吉尼亚鸢尾（Iris-virginica），共 150
82820编辑于 2022-07-27
来自专栏foochane
KNN算法应用
利用Iris数据集来使用KNN算法 1.1 Iris数据集介绍 ? Iris数据集是常用的分类实验数据集，由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集，是一类多重变量分析的数据集。 4.6, 3.2, 1.4, 0.2], [ 5.3, 3.7, 1.5, 0.2], [ 5. , 3.3, 1.4, 0.2], [ 7. "The use of multiple measurements in taxonomic problems"\n Annual Eugenics, 7, Part II, 179-188 ( 自己实现KNN算法 2.1 数据 irisdata.txt，和前面的一样，只不过是txt格式的 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa sorted(classVotes.items(), key=operator.itemgetter(1), reverse=True) return sortedVotes[0][0] # 计算算法的准确率
93520发布于 2019-05-23
来自专栏人工智能
KNN算法API
有时候出现K值选择困难的问题 KNN算法的关键是什么？答案一定是K值的选择，下图中K=3，属于红色三角形，K=5属于蓝色的正方形。这个时候就是K选择困难的时候。创建网格搜索对象 estimator = KNeighborsClassifier() param_grid = {'n_neighbors': [1, 3, 5, 7]} estimator = GridSearchCV 测试集评估模型 print('测试集准确率:', estimator.score(x_test, y_test)) 3.小结 KNN 算法中K值过大、过小都不好，一般会取一个较小的值 GridSearchCV 工具可以用来寻找最优的模型超参数，可以用来做KNN中K值的选择 K近邻算法的优缺点：优点：简单，易于理解，容易实现缺点：算法复杂度高，结果对K取值敏感，容易受数据分布影响本期主要介绍了KNN算法的 API及分类划分的方法及评估，下一期我们将会引入案例更好的理解和巩固KNN算法，下期还将介绍距离的度量方法
42810编辑于 2024-07-30
来自专栏Hsinyan写字的地方
kNN分类算法
算法简介 KNN（K-Nearest Neighbor）算法是机器学习算法中最基础、最简单的算法之一。它既能用于分类，也能用于回归。KNN通过测量不同特征值之间的距离来进行分类。 KNN算法的思想非常简单：对于任意n维输入向量，分别对应于特征空间中的一个点，输出为该特征向量所对应的类别标签或预测值。 # 0.3064319992975, # 2.5786840957478887] # 距离从小到大的索引值 nearest = np.argsort(distances) # array([8, 7, kNN算法中的k 支持向量机的C和sigma超参数。 kNN算法中的超参数超参数k 在上面的示例中，k的值都是由我们自己手动设定，由k设置的不同，模型的准确率也不同，那么k取多少的时候，能够得到最优解呢？
1.2K20编辑于 2022-06-19
来自专栏数据挖掘
KNN近邻算法
K近邻(KNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。 -- 邻近算法百度百科 KNN近邻算法思想根据上文 K-means 算法分类，可以将一堆毫无次序的样本分成N个簇，如下： ? 近邻算法就是以一定量的训练样本，来对其他未知样本进行分类，分类的标准和选取的K值有很大关系 KNN近邻算法实现假设训练样本为： clusters = { 'cluster2': {'H': { 23, 'x': 26}, 'E': {'y': 23, 'x': 38}, 'B': {'y': 23, 'x': 6}, 'L': {'y': 15, 'x': 7}
1.2K40发布于 2019-07-02
来自专栏大数据风控
R分类算法-KNN算法
分类(Classification)：分类算法通过对已知类别训练数据集的分析，从中发现分类规则，以此预测新数据的类别，分类算法属于监督学习的类型。 KNN算法（K Nearest Neighbors） K近邻节点算法 KNN算法从训练集中找到和新数据最接近的K条记录，然后根据他们的主要分类来决定新数据的类别。 ”包中 install.packages(“class”) knn(train,test,cl,k=1) train 训练数据 test 测试数据 cl 训练数据的正确结果 k /Iris_flower_data_set #https://zh.wikipedia.org/wiki/%E5%AE%89%E5%BE%B7%E6%A3%AE%E9%B8%A2%E5%B0%BE%E8% =iris.train$Species, k=3 ) table(iris.test$Species, result.KNN) result.KNN setosa versicolor
1.9K70发布于 2018-01-09
来自专栏机器学习初学者精选文章
(视频+图文)机器学习入门系列-第7章 KNN算法
本系列的目录 01.引言 02.回归 03.逻辑回归 04.朴素贝叶斯 05.机器学习实践 06.机器学习库Scikit-learn 07.KNN算法 08.决策树 09.集成学习 10.人工神经网络 11.支持向量机 12.聚类 13.降维 14.关联规则 15.机器学习项目流程本章目录 7.1 距离度量 7.2 KNN算法 7.3 KD树划分 7.4 KD树搜索 7.1 距离度量视频讲解图文内容 7.2 KNN算法视频讲解图文内容 7.3 KD树划分视频讲解图文内容 7.4 KD树搜索视频讲解图文内容相关资源课程门槛较低
43810编辑于 2022-02-23
来自专栏图灵技术域
KNN算法MATLAB实现
一、kNN概念描述请参考：https://www.omegaxyz.com/2018/01/08/knn/ kNN算法又称为k最近邻(k-nearest neighbor classification )分类算法。 kNN算法的核心思想是，在一个含未知样本的空间，可以根据离这个样本最邻近的k个样本的数据类型来确定样本的数据类型。该算法涉及3个主要因素：训练集、距离与相似的衡量、k的大小；主要考虑因素：距离与相似度的；二、举例说明右图中，绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形？三、MATLAB实现 KNN.m：KNN标签预测，输入测试数据、样本数据、样本标签、K值输出数据：对单个样本预测的标签值 MATLAB function relustLabel = KNN(inx
1.6K20发布于 2021-05-21
来自专栏大数据技术栈
KNN近邻算法详解
什么是 KNN近邻算法？通常我们都知道这么一句话 “近朱者赤近墨者黑” ， KNN算法就是这句话的完美诠释了。 KNN近邻算法实践这里我们会使用到 sklearn 和 numpy 两个库，当然就算你不熟悉也没关系，这里主要就是为了直观的感受一下 KNN 算法。 KNN 的原理吧 KNN算法手写实现思路首先我们理一下，knn的几个关键因素： ① neighbors，我们该选取几个邻居作为目标分类的依据。话虽如此，但是如果你觉得这样就可以用好 KNN 那就有点太想当然了, 学好一个算法不是目的，用好一个算法才是真正的牛逼... 下面我们就来谈谈 KNN 的调参... KNN是否可以用于回归算法？
1.2K20发布于 2019-10-30
来自专栏Jack96
机器学习_knn算法_1
K-近邻算法（KNN）勾股定理，如何进行电影分类众所周知，电影可以按照题材分类，然而题材本身是如何定义的? 本章介绍第一个机器学习算法：K-近邻算法，它非常有效而且易于掌握。 #KNN算法是有监督的学习,数据必须带有目标值 #要求数据的样本要平衡 #要清楚k值的作用:找周围离自己最近的几个数据 #数据处理 #建立模型->训练数据->模型评估->预测数据 #机器学习应对的三种数据 sklearn ： scikit-learn :机器学习 KNeighborsClassifier ：分类(有监督的学习)算法（很少遇到回归的算法）步骤： 1.先实例化一个空模型 knn = KNeighborsClassifier sklearn.neighbors import KNeighborsRegressor 鸢尾花识别用于分类导包，机器学习的算法KNN、数据蓝蝴蝶 In [16]: iris=sns.load_dataset
71840编辑于 2023-03-07
来自专栏Jack96
机器学习_knn算法_2
0.92） /0.98 对 0.89（训练的数据中没有异常值）欠拟合：两者都低，或则差异较大（一般不会出现这种情况，数据量及其少的时候会出现）网格搜索（找值高的）和交叉验证（找相对较高的）(优化算法 ) grid search & cross validation GridSearchCV (可见网络搜索较重要一些) estimator : 估计器，算法(要求写算法的实例，knn) param_grid ：估计器的参数，k的值，要求是一个散列表（n_neighbors:[1,3,5,7,10]）（散列类型，hash） cv ：指定折交的次数网络搜索：用for循环遍历k 的值然后训练得分（计算量较大）交叉验证：数据部分，多次抽取数据进行验证（3/7每次抽取70%），大量的随机测试保证模型的稳定性效率低下： k的值可以取16，一共抽取十组数据，效率比之前低160倍优化找到 ), fit_params=None, iid=True, n_jobs=2, param_grid={'n_neighbors': [1, 2, 3, 4, 5, 6, 7,
62340编辑于 2023-03-07
来自专栏python3
kNN分类算法实例1：用kNN改进约会网
原著中，所有归一化、kNN算法，分类器都是作者自己写的。代码可以用于理解算法原理，用于使用就没有必要，而且代码基于的版本是2.7，难以直接使用。源代码及其详解可以参考以下链接：机器学习实战—k近邻算法(kNN)02-改进约会网站的配对效果既然有了优秀的sklearn库可以为我们提供现成的kNN函数，为什么不直接调用它呢？自带的kNN算法做分类的流程: 用sklearn实现knn算法的实现流程以下是代码（更多细节请参考附在最后的参考资料）: #! 官网归一化、标准化、正则化介绍及实例如何使用sklearn中的knn算法? 用sklearn实现knn算法的实现流程洗牌函数shuffle()和permutation()的区别是什么? 如何使用with open（）as filename?
2.3K10发布于 2020-01-16
来自专栏Flaneur的文章分享
KNN算法及python实现
前言 KNN算法即K-Nearest Neighbor，也是机器学习十大经典算法之一。前文讲解了K-means算法，今天我们就继续讲KNN算法，两者看起来挺相似的，但区别还是很大的，看完本片文章你就会明白了。一、引入问题：确定绿色圆是属于红色三角形、还是蓝色正方形？ ? 我们可以看到，KNN本质是基于一种数据统计的方法！其实很多机器学习算法也是基于数据统计的。二、KNN算法 1.介绍 KNN即K-最近邻分类算法（K-Nearest Neighbor），是一种memory-based learning，也叫instance-based learning 五、python实例实现下面引入一个实例，通过python代码具体看下KNN算法的流程。
1.7K20发布于 2020-03-25
来自专栏python3
KNN算法的Python实现
# KNN算法思路： #-----------------------------------------------------# #step1:读入数据，存储为链表 #step2:数据预处理，包括缺失值处理 archive.ics.uci.edu/ml/datasets/Adult # Author :CWX # Date :2015/9/1 # Function: A classifier which using KNN ":1,"fnlwg":2,"education":3,"education-num":4, "marital-status":5,"occupation":6,"relationship":7, Bachelors"," Some-college"," 11th"," HS-grad"," Prof-school", " Assoc-acdm"," Assoc-voc"," 9th"," 7th "H:\BaiduYunDownload\AdultDatasets\Adult_data.txt" #sample = [" 80"," Private"," 226802"," 11th"," 7"
63510发布于 2020-01-06
来自专栏浪浪山下那个村
K近邻算法(KNN)详解
基本概念 K近邻算法，即是给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的K个实例，这K个实例的多数属于某个类，就把该输入实例分类到这个类中。从上面例子我们可以看出，k近邻的算法思想非常的简单，也非常的容易理解，那么我们是不是就到此结束了，该算法的原理我们也已经懂了，也知道怎么给新来的点如何进行归类，只要找到离它最近的k个实例，哪个类别最多即可缺点:需要大量的空间储存已知的实例、算法的复杂度高.因为这类样本实例的数量过大，但这个新的未知实例实际并未接近目标样本.
75030编辑于 2022-06-17
来自专栏caoqi95的记录日志
KNN （K 邻近）分类算法
KNN 是第 7 天的学习内容。什么是 KNN？ KNN，K-Nearest Neighbours ，K值邻近算法，是一个简单的，常被用于分类问题的算法。它也可以用于回归问题。由于 KNN 是基于实例的算法，也常被称呼为懒算法（lazy algorithm）。了解了下面 KNN 的原理，也就知道为什么它会被称为 lazy algorithm。 :） KNN 算法原理当 KNN 被用于分类问题时，其输出是一个类别的成员（预测一个类别 - 一个离散值）该算法包含三个元素：标记对象的集合（比如：一个分数记录的集合），对象之间的距离，k 的取值可以发现 KNN 是通过测量不同样本之间的距离进行分类的。KNN 算法的核心思想是:如果一个样本在特征空间中的 k 个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别。 K Nearest Neighbours | Day 7 - 100 Days of ML Code [2]. 机器学习（一）——K-近邻（KNN）算法
1.6K30发布于 2019-03-27
来自专栏后端知识体系
kNN（k-近邻算法）
**k-近邻算法（kNN），**它的工作原理是：存在一个样本数据集合，也称作训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的对应关系。输人没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。 k-近邻算法的一般流程收集数据：可以使用任何方法。准备数据：距离计算所需要的数值，最好是结构化的数据格式。分析数据：可以使用任何方法。训练算法：此步驟不适用于k-近邻算法。测试算法：计算错误率。使用算法：首先需要输入样本数据和结构化的输出结果，然后运行k-近邻算法判定输入数据分别属于哪个分类，最后应用对计算出的分类执行后续的处理。使用欧氏距离公式，计算两个向量点xA和xB之间的距离：例如，点 (0 ,0) 与 (1, 2) 之间的距离计算为：如果数据集存在 4 个特征值，则点 (1 ,0, 0 ,1) 与 (7, 6,
65810编辑于 2022-07-14

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

KNN算法

KNN算法

深入浅出KNN算法（一） KNN算法原理

数据挖掘算法-KNN算法

KNN算法应用

KNN算法API

kNN分类算法

KNN近邻算法

R分类算法-KNN算法

(视频+图文)机器学习入门系列-第7章 KNN算法

KNN算法MATLAB实现

KNN近邻算法详解

机器学习_knn算法_1

机器学习_knn算法_2

kNN分类算法实例1：用kNN改进约会网

KNN算法及python实现

KNN算法的Python实现

K近邻算法(KNN)详解

KNN （K 邻近）分类算法

kNN（k-近邻算法）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

KNN算法

KNN算法

深入浅出KNN算法（一） KNN算法原理

数据挖掘算法-KNN算法

KNN算法应用

KNN算法API

kNN分类算法

KNN近邻算法

R分类算法-KNN算法

(视频+图文)机器学习入门系列-第7章 KNN算法

KNN算法MATLAB实现

KNN近邻算法 详解

机器学习_knn算法_1

机器学习_knn算法_2

kNN分类算法实例1：用kNN改进约会网

KNN算法及python实现

KNN算法的Python实现

K近邻算法(KNN)详解

KNN （K 邻近）分类算法

kNN（k-近邻算法）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

KNN近邻算法详解