首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >模型的维数和k近邻的性能之间的关系背后的直觉是什么?

模型的维数和k近邻的性能之间的关系背后的直觉是什么?
EN

Stack Overflow用户
提问于 2016-06-04 05:38:32
回答 1查看 37关注 0票数 1

关于k近邻的属性,在统计学习元素第38页中,作者写道:

"...as维数p变大了,k最近邻域的度量大小也变大了。因此,以最近的邻域作为条件的代用品,我们将很不幸地失败。“

这是否意味着,当我们在模型中添加特征时,保持k常数,结果之间的距离和邻域的大小都会增加,所以模型的方差会增加吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-06-04 13:24:06

维度诅咒有不同的形状。特别是对于机器学习,有一个讨论这里

一般来说,随着维数的增加,点间距离的相对差异越来越小。对于d=1000维数,随机数据集中的任何点A比任何其他点都更接近给定点B,这是非常不可能的。在某种程度上,这可以通过这样的方式来解释:在d=1000中,A点在绝大多数维度上都很不可能接近点B(至少不太可能比任何其他任意点更近)。

另一个方面是,体积性质变得不直观地增加'd‘。例如,即使假设一个相对中等的d=25 (如果我没记错),单位立方体的体积(边长= 1)也比单位球的体积(直径=1的球体)大1,000,000。我之所以提到这一点,是因为您的引用提到了“公制大小”,但我不确定这对kNN有何影响。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37626779

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档