问可视化类别的方差/标准差
EN

Data Science用户

提问于 2019-09-29 04:21:48

回答 1查看 306关注 0票数 0

数据结构：

Method Category   Variance for X
1         A             20
1         B             14
1         C             16
2         A             14
2         B             19

其中X不是用于分类，而是评价标准。目标是选择方法，在大多数类/总体方差最小的情况下，对X产生最小可能方差的分类。

我的问题是:是否有一些标准(或模糊的)方法来可视化大量类别的差异？

visualization

回答 1

Data Science用户

回答已采纳

发布于 2019-09-29 07:02:12

我知道这可能不完全符合你的需要，但我的第一个想法将不是形象化的差异。相反，我将为每个方法定义一个度量。

例如，考虑到给定的所有结果，您有一个输出向量(每个类别的X为一个方差)，然后您可以简单地计算该向量的p-范数，并将其与其他方法获得的范数进行比较：

\left\lVert x\right\rVert_p = \left( \sum_{i=1}^n x_i^p \right)^{1/p}

p=2给你欧几里德范数，你可以增加或减少p，这取决于你想要提高对最大值或平均值的关注。

在可视化方面，您可以简单地绘制(例如，在条形图中)所选择的一些规范(例如，命令1、2和无穷大)。

为了进行纯粹的可视化，您可以用小提琴的情节来绘制数据。例如，在python中：

import seaborn as sns
sns.violinplot(x="Method", y="Variance for X", data=your_data_as_df)

每把小提琴都会让你了解数据是如何分布在所有类别的。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/60981

复制

相似问题

问可视化类别的方差/标准差
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问可视化类别的方差/标准差EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问可视化类别的方差/标准差
EN