上下文:我使用带有泊松似然(和日志/exp链接)的SVGP训练了一个模型。除了预测计数外,我还想做一个不确定度的测量。
函数m.predict_y提供了预测均值和预测方差。对于泊松似然,它使用高斯-Hermite求积的Likelihood.predict_mean_and_var的默认实现.
这是计算计数(即我们的目标/因变量)的期望,还是泊松参数的期望?
如果我正确理解代码,我们将得到泊松参数(i)的预测均值/方差。
在我目前的方法中,我重写了predict_mean_and_var,使它使用mcmc方法ndiag_mc_perc而不是hermite-gauss近似,然后返回样本的10%/90%的百分位数。
发布于 2019-08-29 16:33:58
简短的回答:predict_y预测y的均值和方差,它总是在观察空间中,即与传递给模型构造函数的Y所在的空间相同。在这种情况下,它是计数的平均值和方差,你的第二点(ii)。对于泊松分布,给定强度的均值和方差总是相同的,即以潜在的GP f值为条件,对于泊松似然模型,由于f中的不确定性积分,predict_y返回的均值和方差之间会有很小的差异。
只有在有多个观测的情况下才能讨论强度上的不确定性,但在GPflow中实现的泊松似然中,一个Y构成一个单独的观测(因为每个观测通常包含多个事件)。你可以建立一个知道多个观测的可能性,然后你会看到更多观测的不确定性减少,就像你所期望的那样。
(如果您的计数方差不等于计数期望,您可能需要考虑低于或过分散的计数概率,例如负二项数或其他。)
https://stackoverflow.com/questions/57711678
复制相似问题