首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在一组相关变量中,我如何推断哪个变量子集最好地描述了其余变量?

在一组相关变量中,我如何推断哪个变量子集最好地描述了其余变量?
EN

Stack Overflow用户
提问于 2017-01-04 03:12:00
回答 1查看 105关注 0票数 2

我有一个由60个传感器组成的数据集,进行了1684次测量。我希望减少实验期间使用的传感器数量,并使用剩余的传感器数据来预测(使用机器学习)删除的传感器。

我已经查看了数据(参见image),并发现了传感器之间的几个强相关性,这应该可以删除X传感器,并使用剩余的传感器来预测它们的行为。

我如何对哪组传感器(X)进行“评分”,以最好地预测剩余的一组(60-X)?

EN

回答 1

Stack Overflow用户

发布于 2017-01-04 05:18:45

你熟悉主成分分析(PCA)吗?它是方差分析(ANOVA)的产物。降维是描述这一过程的另一个术语。

这些通常针对预测单个输出的一组输入,而不是一组对等测量。为了使你的情况适应这些方法,我认为你应该首先考虑60个传感器中的每一个,依次作为“地面事实”,看看哪些可以由其余的最可靠地驱动。删除它们并重复该过程,直到达到所需的相关性阈值。

我还建议用一种遗传方法来进行这种筛选;也许随机森林在这一阶段会有所帮助。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41450727

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档