首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >功能选择

功能选择
EN

Stack Overflow用户
提问于 2013-03-06 17:16:45
回答 1查看 534关注 0票数 0

我有以术语为维度的文档术语数据。我必须对术语执行特征选择,并且我打算使用相互信息作为执行特征选择的度量。我的疑问是,在计算所有可能的对之间的互信息之后,应该做什么?我是否应该设置一个阈值,并选择在该阈值内的所有术语对?

EN

回答 1

Stack Overflow用户

发布于 2013-03-06 21:17:08

如果你想使用互信息,你可以考虑使用mRMR算法。你可以用这种算法来选择特征。我的意思是:

代码语言:javascript
复制
You have n features at your data set (it means n dimensions)

如果你想使用最有意义的

代码语言:javascript
复制
k of n (k < n)

您可以使用功能选择(即使用交互信息背景的mRMR )

决定k取决于某些情况。

其中之一是你不想在你的模型中使用不必要的功能,你想要避免计算成本,并从你的数据集中移除一些功能creation.

  • Other

你应该在删除一些功能后测试你的算法。你检查精确度是否会上升,而根据你的目标,精确度甚至会下降,这是否会导致避免计算成本(所以你可能也想去掉一些特性)

另一方面,我建议您考虑特征提取方法,即PCA和LDA (特别是针对您的情况)。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15243229

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档