首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >K近邻验证性能

K近邻验证性能
EN

Stack Overflow用户
提问于 2014-05-22 15:21:26
回答 1查看 440关注 0票数 0

我正在使用knn对一个电信问题进行分类。我把我的数据分成了70%的训练和30%的验证。虽然knn分类器在训练中能够在2个十进制内捕获80%以上,但其在验证样本中的性能与随机45度线相当。我很惊讶KNN是如何工作的,模型在训练和验证方面的表现是如此不同。

有什么建议吗?

EN

回答 1

Stack Overflow用户

发布于 2014-05-22 16:18:52

没有更多的细节,合理的指针几乎是不可能的。KNN的行为取决于以下几个方面:

  • 定义邻居的参数K。例如,如果它设置为K=1,您将根本不会得到训练错误,这表明考虑训练到验证错误可能是不合理的。
  • 参数K经常使用cross validation。我建议你也这样做。
  • 距离度量。你使用的是哪个函数,有没有不同的单位,不同的长度刻度,等等?
  • 你数据的噪音,你数据的大小... --只存在很难描述的数据集。

顺便说一句:你能说出你想描述的数据类型吗,如果可能的话,还能提供一些例子或显示一些散点图(数据和你的结果)吗?

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23800249

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档