数据结构:
Method Category Variance for X
1 A 20
1 B 14
1 C 16
2 A 14
2 B 19其中X不是用于分类,而是评价标准。目标是选择方法,在大多数类/总体方差最小的情况下,对X产生最小可能方差的分类。
我的问题是:是否有一些标准(或模糊的)方法来可视化大量类别的差异?
发布于 2019-09-29 07:02:12
我知道这可能不完全符合你的需要,但我的第一个想法将不是形象化的差异。相反,我将为每个方法定义一个度量。
例如,考虑到给定的所有结果,您有一个输出向量(每个类别的X为一个方差),然后您可以简单地计算该向量的p-范数,并将其与其他方法获得的范数进行比较:
p=2给你欧几里德范数,你可以增加或减少p,这取决于你想要提高对最大值或平均值的关注。
在可视化方面,您可以简单地绘制(例如,在条形图中)所选择的一些规范(例如,命令1、2和无穷大)。
为了进行纯粹的可视化,您可以用小提琴的情节来绘制数据。例如,在python中:
import seaborn as sns
sns.violinplot(x="Method", y="Variance for X", data=your_data_as_df)每把小提琴都会让你了解数据是如何分布在所有类别的。
https://datascience.stackexchange.com/questions/60981
复制相似问题