我想要计算在多个向量中出现的频率,并希望得到的bin的数量在向量之间保持一致,以便更容易计算它们之间的wasserstein距离。
下面的代码显示直方图给出了不同大小的柱状图。
using StatsBase
for i in 1:10
h = fit(Histogram,randn(1000), nbins=10); println(size(h.weights))
end如何使存储桶数量保持一致?
发布于 2020-12-19 21:45:19
在所有运行中保持完全一致的一种方法是提供比垃圾桶数量更多的数量;为了完全一致,我们还提供了它们的确切位置。对于Julia的StatsBase,您可以通过提供“边框边界”来做到这一点。这是一个从i到i+1运行回收站的演示
julia> fit(Histogram, randn(1000), -5:5)
Histogram{Int64, 1, Tuple{UnitRange{Int64}}}
edges:
-5:5
weights: [0, 2, 23, 139, 319, 355, 143, 18, 1, 0]
closed: left
isdensity: falsehttps://stackoverflow.com/questions/65366120
复制相似问题