我正在通过“Python机器学习入门:数据科学家指南”一书来教自己机器学习,我现在在k近邻部分。作者指出,由于“预测速度慢,不能处理多个特征”,该算法在实际生活中很少使用。然而,在许多文章中,k近邻被提到是数据科学家最流行的算法之一。有人能在这里给我解释一下吗?
发布于 2018-12-10 11:42:25
由于K近邻问题的性质,它在机器学习中有着广泛的应用。换句话说,k近邻问题是最基本的问题,它在许多问题的解决中都得到了应用。例如,在数据表示(如tSNE )中,要运行该算法,我们需要根据预定义的困惑计算每个点的k-最近邻。
此外,您可以在kNN 这里的最后一页中找到更多的这篇文章应用程序及其在行业中的应用。
KNN算法是目前最流行的文本分类或文本挖掘算法之一。 另一个令人感兴趣的应用是森林清单的评估和森林变量的估计。在这些应用中,使用了卫星图像,目的是绘制很少离散类别的土地覆盖和土地利用图。K-神经网络方法在农业中的其他应用包括气候预报和土壤水分参数估计。 KNN在Financial中的其他一些应用如下:
Medicine
KNN算法还应用于微阵列基因表达数据的分析,KNN算法与遗传算法相结合,作为搜索工具。其他应用包括预测蛋白质分子中溶剂的可达性,检测计算机系统中的入侵,以及管理移动对象的数据库,如具有无线连接的计算机。
https://stackoverflow.com/questions/53704811
复制相似问题