目前,我正在阅读the可视化技术,有人提到,使用主成分分析可视化高维数据的缺点之一是,它只保留大的两两点之间的距离。意思是,在高维中相距很远的点在低维时也会出现很远的距离,但除此之外,所有其他点的距离都会被扭曲。
有人能帮我理解一下为什么是这样吗?从图形上来说,这意味着什么?
非常感谢!
发布于 2015-10-13 05:02:56
不要混淆PCA和降维。
主成分分析( PCA )是一种旋转变换,它使数据与轴对齐,使得第一维的方差最大,剩余空间中的第二最大方差等。旋转保持成对距离。
当您使用PCA进行降维时,您将丢弃具有最小方差的旋转数据的维度。当点的分布距离均值很远时,就会得到很高的方差。低方差维度是那些,其中的值大多是相同的,因此,它们的缺失被认为对配对距离的影响最小。
发布于 2021-02-10 17:48:56
如果我能改称@ does的评论: PCA转换本身不会改变距离。通常用于可视化PCA结果的二维图只考虑了两个维度,而忽略了所有其他维度,因此这种可视化提供了对距离的扭曲表示。
https://stackoverflow.com/questions/33092493
复制相似问题