我有一个由60个传感器组成的数据集,进行了1684次测量。我希望减少实验期间使用的传感器数量,并使用剩余的传感器数据来预测(使用机器学习)删除的传感器。
我已经查看了数据(参见image),并发现了传感器之间的几个强相关性,这应该可以删除X传感器,并使用剩余的传感器来预测它们的行为。
我如何对哪组传感器(X)进行“评分”,以最好地预测剩余的一组(60-X)?
发布于 2017-01-04 05:18:45
你熟悉主成分分析(PCA)吗?它是方差分析(ANOVA)的产物。降维是描述这一过程的另一个术语。
这些通常针对预测单个输出的一组输入,而不是一组对等测量。为了使你的情况适应这些方法,我认为你应该首先考虑60个传感器中的每一个,依次作为“地面事实”,看看哪些可以由其余的最可靠地驱动。删除它们并重复该过程,直到达到所需的相关性阈值。
我还建议用一种遗传方法来进行这种筛选;也许随机森林在这一阶段会有所帮助。
https://stackoverflow.com/questions/41450727
复制相似问题