首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于变量值的降维方法

基于变量值的降维方法
EN

Data Science用户
提问于 2019-07-06 01:54:40
回答 1查看 59关注 0票数 1

我有一个包含100 k高维数据的数据集(例如LA中的房屋) (dim=100,例如房屋参数,如面积、到市中心的距离等)。下面是由目标值(如房价)着色的数据的两分量PCA表示。

正如你所看到的,价格函数具有随机性,并且在任何地方都会发生迅速的变化。

  1. 是否有一种将目标值考虑在内的降维方法,其结果是一方面聚集廉价住房,然后在地图上看到房价的梯度?
  2. 多方面的学习对这项任务有帮助吗?

我尝试了基于岭回归的后向特征提取,根据它们对目标值回归结果的影响来降低维数,然后应用主成分分析( PCA )进行归一化,但输出结果并不理想。这是输出:

谢谢

EN

回答 1

Data Science用户

回答已采纳

发布于 2019-07-08 11:35:54

其实第一个情节还是更好!首先要提到的是,在2d,你丢失了大量的信息,也就是说,这些情节都不一定能告诉你什么。如果2d情节是好的,你可以快乐,但如果不是,你不一定会失望!我强烈建议您通过评估回归模型来查看降维的性能。

对于100个维度,我将首先尝试找到特征和目标之间的相关性/依赖性(尝试在没有可视化的情况下不要使用线性关联!)然后,在所有功能中删除非信息功能。在剩下的特征上,尝试不同的降维算法(不只是PCA,例如NMF,如果值都是非负的和/或LLE)具有更多的维数。在验证集上评估您的结果。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/55162

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档