首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么seaborn.dist和pyplot.hist在相同的数据上生成两个不同的外观直方图?

为什么seaborn.dist和pyplot.hist在相同的数据上生成两个不同的外观直方图?
EN

Data Science用户
提问于 2019-07-30 09:53:31
回答 2查看 2K关注 0票数 4

我在看电信客户的数据。我目前正在研究的两个变量是:

  • 每月收费-每月向客户收取的总金额。
  • 是老年人--顾客是否是老年人。

我正在绘制两个直方图,看看非老年人和老年人的分布是否不同。

如果我使用的是海运的远程图,那么我会得到以下结果

如果我使用pyplot,则会得到以下结果

在第一幅图中,蓝色的在70-120范围内高于橙色的,而在第二幅图像中,蓝色的总是停留在橙色的下方。

这两者有什么区别?

EN

回答 2

Data Science用户

回答已采纳

发布于 2019-07-30 10:01:31

第一个返回分布的概率密度。正如您所看到的,它们集成到1,即它们覆盖相同的区域(因为它们是概率,而不是原始数据)。

第二个返回实际频率,这就是为什么你有数据的实际规模。不同的直方图有不同的刻度。

票数 4
EN

Data Science用户

发布于 2021-08-17 08:37:26

这些绘图函数pyplot.histseaborn.countplotseaborn.displot都是绘制单个变量频率的辅助工具。取决于这个变量的性质,它们可能或多或少适合于可视化。

所有函数pyplot.histseaborn.countplotseaborn.displot都充当matplotlib条形图的包装器,如果手动绘制这种条形图太麻烦,则可以使用这些函数。

对于连续变量,可以使用pyplot.histseaborn.distplot。对于离散变量,seaborn.countplot更方便。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/56612

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档