首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >可视化类别的方差/标准差

可视化类别的方差/标准差
EN

Data Science用户
提问于 2019-09-29 04:21:48
回答 1查看 306关注 0票数 0

数据结构:

代码语言:javascript
复制
Method Category   Variance for X
1         A             20
1         B             14
1         C             16
2         A             14
2         B             19

其中X不是用于分类,而是评价标准。目标是选择方法,在大多数类/总体方差最小的情况下,对X产生最小可能方差的分类。

我的问题是:是否有一些标准(或模糊的)方法来可视化大量类别的差异?

EN

回答 1

Data Science用户

回答已采纳

发布于 2019-09-29 07:02:12

我知道这可能不完全符合你的需要,但我的第一个想法将不是形象化的差异。相反,我将为每个方法定义一个度量。

例如,考虑到给定的所有结果,您有一个输出向量(每个类别的X为一个方差),然后您可以简单地计算该向量的p-范数,并将其与其他方法获得的范数进行比较:

\left\lVert x\right\rVert_p = \left( \sum_{i=1}^n x_i^p \right)^{1/p}

p=2给你欧几里德范数,你可以增加或减少p,这取决于你想要提高对最大值或平均值的关注。

在可视化方面,您可以简单地绘制(例如,在条形图中)所选择的一些规范(例如,命令1、2和无穷大)。

为了进行纯粹的可视化,您可以用小提琴的情节来绘制数据。例如,在python中:

代码语言:javascript
复制
import seaborn as sns
sns.violinplot(x="Method", y="Variance for X", data=your_data_as_df)

每把小提琴都会让你了解数据是如何分布在所有类别的。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/60981

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档