首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何显示计数与比率之间的相关性?

如何显示计数与比率之间的相关性?
EN

Stack Overflow用户
提问于 2020-06-05 13:40:35
回答 3查看 416关注 0票数 0

我的数据集

代码语言:javascript
复制
Name rate  counts
A    10.3  3
B    15.4  9
C    21.9  11
D    9.11  4
E    2.21  5
F    7.7   21
G    18.9  20
H    55.1  41

数据集显示具有不同名称的人的数量和比率。

我想知道比率与计数的相关性。

例如,如果计数高,则比率高或低。

哪种方法适合显示两者之间的联系?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2020-06-05 17:39:35

检查此代码:

代码语言:javascript
复制
# import requires packages
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# read the data file
df = pd.read_csv('data.csv')

# calculate correlation matrix
corr = df.corr()

# prepare the plot
sns.heatmap(corr, annot = True, vmin = 0, vmax = 1)

# show the plot
plt.show()

它给出了以下相关矩阵:

如您所见,ratecount之间的相关性很高:0.85。但是,考虑到我只使用了您上面报告的数据,只有8行,也许您应该使用更高的示例来获得更可靠的结果。

票数 2
EN

Stack Overflow用户

发布于 2020-06-05 13:45:44

您只需要使用Pandas函数来计算关联:

代码语言:javascript
复制
df.rate.corr(df.counts)

它支持三种方法:“pearson”(默认)、“kendall”和“spearman”。更多细节可以找到这里

票数 2
EN

Stack Overflow用户

发布于 2020-06-05 13:49:54

您可以尝试使用numpy来获得两个变量之间的系数。

代码语言:javascript
复制
import numpy
a = [10.3, 15.4, 21.9, 9.11, 2.21, 7.7, 18.9, 55.1]
b = [3, 9, 11, 4, 5, 21, 20, 41]
print(numpy.corrcoef(a,b))

如果反对角线中的值为正且接近于1,则它们之间的相关性更强。结果是

代码语言:javascript
复制
[[1.         0.84965646] 
 [0.84965646 1.        ]]

系数值约为0.85。这意味着它们是高度相关的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62216690

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档