我在看电信客户的数据。我目前正在研究的两个变量是:
我正在绘制两个直方图,看看非老年人和老年人的分布是否不同。
如果我使用的是海运的远程图,那么我会得到以下结果

如果我使用pyplot,则会得到以下结果

在第一幅图中,蓝色的在70-120范围内高于橙色的,而在第二幅图像中,蓝色的总是停留在橙色的下方。
发布于 2019-07-30 10:01:31
第一个返回分布的概率密度。正如您所看到的,它们集成到1,即它们覆盖相同的区域(因为它们是概率,而不是原始数据)。
第二个返回实际频率,这就是为什么你有数据的实际规模。不同的直方图有不同的刻度。
发布于 2021-08-17 08:37:26
这些绘图函数pyplot.hist、seaborn.countplot和seaborn.displot都是绘制单个变量频率的辅助工具。取决于这个变量的性质,它们可能或多或少适合于可视化。
所有函数pyplot.hist、seaborn.countplot和seaborn.displot都充当matplotlib条形图的包装器,如果手动绘制这种条形图太麻烦,则可以使用这些函数。
pyplot.hist或seaborn.distplot。对于离散变量,seaborn.countplot更方便。https://datascience.stackexchange.com/questions/56612
复制相似问题