首先,让我描述一下我的问题。
我有按年龄组别划分的出勤率pdf的数据。但是,在源代码中3-5岁是捆绑在一起的。我将3-5岁的年龄组除以3,得到了每年的平均百分比。但是,我现在想要估计概率密度函数的平滑形状。
从视觉上看,它看起来像这样:

现在,考虑到分布的其余部分,我们有理由认为,5岁的孩子比3岁的孩子更多。为了估计这种平滑的分布,我计划使用seaborn和matplotlib以更高的带宽进行内核密度估计。
这些都需要一维数组的数据,而我的数据是二维的:
age = [2,3,4,5,6,7,8,9,10,11,12,13,14,15]
density = [5.6, 9.8, 9.8, 9.8, 13.6, 12.1, 9.6, 7.6, 6.4, 5.4, 4.6, 2.8, 1.4, 1]那么有没有办法(a)用2-d数据做kde,或者(b)把2-d数据转换成1-d密度数据?
发布于 2019-12-03 04:03:51
对于1D kde,您可以这样做:
pd.Series(density).plot.kde(ind=age)这就给出了:

https://stackoverflow.com/questions/59145783
复制相似问题