我想知道为什么在海里出生的图书馆里有盒子情节,为什么会有博克森情节呢?
我知道boxen绘图优化了一种表示数据的方法,特别是对于大型数据集,但是我不知道为什么,另外,我没有任何充分的理由使用boxen图。
发布于 2018-09-19 15:14:57
根据我对本文描述了这一概念。的理解(或作者所称的“字母值图”),目标是提供比boxplot更好的数据分布表示。当存在大量异常值时),但不需要选择特定的参数,例如violinplot使用的KDE函数,如果选择不当,可能会扭曲分布的外观。
以下是三种情节的比较:

发布于 2021-01-25 23:59:03
方框图显示中间线为中心线(第50百分位数),然后为第25和第75百分位数作为框界。然后使用IQR方法计算孤立点边界(例如,上边界为1.5* IQR + Q3 )。Q3是第三个四分位数,即数据的第75个百分位数(75%的数据低于此值)。异常晶须外的离群点被显示为不同的点。
better (实际上在原始论文和letter包中称为字母值图)以不同的方式显示分布,并且更适合较大的数据集。经典的盒形图可能有太多的离群点,而不显示太多关于发行的信息。以中间线(Q2,第50百分位数)开始。向外连续的每一层都包含其余数据的一半。所以从中心线出来的前两部分包含了50%的数据。之后,接下来的两个部分包含了25%的数据。这种情况一直持续到我们处于离群点的水平。每一个水平都是阴影打火机。有4种计算异常值的方法(在本文中描述,在海运中可用)。默认情况下,每个尾部都有大约5-8个离群值。
我用Diziet的好身材来说明:

原纸 (来自于作者,包括Hadley Wickham)被链接在海运boxenplot文档中。
https://stackoverflow.com/questions/52403381
复制相似问题