我有两个数据集,我想做一个皮尔逊相关分析。我已经进行了有意义的分析,但考虑到这两个数据集在不同的尺度上都有值,我想确定它是有效的。
两个数据集中的特性完全相同(当然,实际的样本是不同的)。数值范围如下:
dataset1 = 3-20
dataset2 = 10-30现在我的理解是,pearson相关系数并不取决于不同数据集的尺度的变化或差异,但是对于我看到的所有例子,虽然尺度不同,但较低的值总是0。不过,您可以看到,一个数据集上的较低值为3,而另一个数据集上的较低值为10。(在任何一种情况下,它们都意味着它们的“低”级别,这正是它们的测量方法。
有人能确认这一切还好吗?
发布于 2020-12-20 12:06:54
对于定量-定量比较,标度通常不重要的先锋,皮尔逊,和肯德尔的相关性。
https://datascience.stackexchange.com/questions/86937
复制相似问题