首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >特征选择& kNN中的重要特征

特征选择& kNN中的重要特征
EN

Stack Overflow用户
提问于 2017-02-03 11:05:36
回答 2查看 3.4K关注 0票数 2

我正在kNN的帮助下开发一个推荐引擎。然而,数据是稀疏的,大约有1500个样本和大约200个特征。我有一个值为1或0的序数目标。

有什么技术可以为它做特征选择呢?我假设如果我选择随机森林进行特征选择,那么选择的特征可能与kNN假设的重要特征不同。

另外,对于包含我的样本数量如此之少的特征数量,是否有任何限制?

EN

回答 2

Stack Overflow用户

发布于 2017-05-03 20:01:26

特征选择技术希望要么排除不相关的特征,要么排除冗余的特征。一种成熟的技术是使用Supervized discretization based on entropy (一些更通用的解释可以在here中找到)来有意义地减少数据的大小,然后使用信息增益来获得与目标变量最相关的前k个特征。你可以尝试至少5种不同的方法,这也取决于你用来实现你的应用程序的ml库/框架。

票数 0
EN

Stack Overflow用户

发布于 2017-09-24 04:39:03

我会尝试使用Relief算法,因为它的核心部分是最近邻搜索。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42016078

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档