文章/答案/技术大牛

发布

社区首页 >问答首页 >基于变量值的降维方法

问基于变量值的降维方法
EN

Data Science用户

提问于 2019-07-06 01:54:40

回答 1查看 59关注 0票数 1

我有一个包含100 k高维数据的数据集(例如LA中的房屋) (dim=100，例如房屋参数，如面积、到市中心的距离等)。下面是由目标值(如房价)着色的数据的两分量PCA表示。

正如你所看到的，价格函数具有随机性，并且在任何地方都会发生迅速的变化。

是否有一种将目标值考虑在内的降维方法，其结果是一方面聚集廉价住房，然后在地图上看到房价的梯度？
多方面的学习对这项任务有帮助吗？

我尝试了基于岭回归的后向特征提取，根据它们对目标值回归结果的影响来降低维数，然后应用主成分分析( PCA )进行归一化，但输出结果并不理想。这是输出：

谢谢

feature-extraction

pca

dimensionality-reduction

回答 1

Data Science用户

回答已采纳

发布于 2019-07-08 11:35:54

其实第一个情节还是更好！首先要提到的是，在2d，你丢失了大量的信息，也就是说，这些情节都不一定能告诉你什么。如果2d情节是好的，你可以快乐，但如果不是，你不一定会失望！我强烈建议您通过评估回归模型来查看降维的性能。

对于100个维度，我将首先尝试找到特征和目标之间的相关性/依赖性(尝试在没有可视化的情况下不要使用线性关联！)然后，在所有功能中删除非信息功能。在剩下的特征上，尝试不同的降维算法(不只是PCA，例如NMF，如果值都是非负的和/或LLE)具有更多的维数。在验证集上评估您的结果。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/55162

复制

相似问题

问基于变量值的降维方法
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于变量值的降维方法EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于变量值的降维方法
EN