文章/答案/技术大牛

发布

社区首页 >问答首页 >如何分析贝叶斯分析的这一结果

问如何分析贝叶斯分析的这一结果
EN

Stack Overflow用户

提问于 2019-04-21 06:19:11

回答 1查看 347关注 0票数 1

我试图用pymc3和bambi软件进行贝叶斯分析。

我的数据形状为136 x5，前5行如下：

   AGE GENDER  AVAR  BVAR   OUTVAR
0   60      F   0.9     0   8260.0
1   56      F   5.4     1  15888.0
2   55      F   1.2     1  19734.4
3   52      F   1.7     1  15904.2
4   49      F   1.6     0  14848.0

其中OUTVAR是目标变量，其他是预测变量。

我使用了以下Python3代码：

from bambi import Model
model = Model(bdf)
results = model.fit('OUTVAR ~ AGE + GENDER + AVAR + BVAR', samples=5000, chains=2)
print(results[1000:].summary())

得到了如下输出：

Auto-assigning NUTS sampler...
Initializing NUTS using advi...
Average Loss = 1,476.2:  21%|██████████████▊                                                       | 10601/50000 [00:01<00:07, 5542.87it/s]
Convergence achieved at 10700
Interrupted at 10,699 [21%]: Average Loss = 1,520.6
Multiprocess sampling (2 chains in 2 jobs)
NUTS: [OUTVAR_sd, BVAR, AVAR, AGE, GENDER, Intercept]
Sampling 2 chains: 100%|██████████████████████████████████████████████████████████████████████████| 11000/11000 [11:40<00:00, 15.71draws/s]
There were 154 divergences after tuning. Increase `target_accept` or reparameterize.
The chain reached the maximum tree depth. Increase max_treedepth, increase target_accept or reparameterize.
There were 241 divergences after tuning. Increase `target_accept` or reparameterize.
The chain reached the maximum tree depth. Increase max_treedepth, increase target_accept or reparameterize.
The number of effective samples is smaller than 10% for some parameters.

                     mean           sd  hpd0.95_lower  hpd0.95_upper  effective_n  gelman_rubin
AGE              6.936836    81.741918    -158.176468     165.050530          589      1.005245
AVAR           -78.356403   410.942267    -896.068374     718.650196         2414      1.000314
BVAR          2639.993063  2262.101985   -1528.841953    7297.760056          553      1.000544
GENDER[T.M]   -615.092080  1659.905226   -3855.789966    2756.704710         1392      1.003126
Intercept    11739.843222  3591.680335    5239.872556   19053.145349          179      1.007447
OUTVAR_sd     8936.351700   283.640474    8402.347757    9318.495791         6027      1.000028

我如何分析，我可以从这张价值表中推断出什么？

编辑：是特定的，我想确认mean是否表示每个变量的系数值。然而，在通常的线性回归中，没有结果变量的系数，而这里列出了。另外，我不清楚每个变量的effective_n值的含义是什么。谢谢你的帮助。

pymc

bambi

bayesian

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-04-21 17:37:49

在这种情况下，mean是后验分布的平均值。对于这样一个简单的例子，后验均值通常接近于传统最小二乘回归得到的估计值。

OUTVAR_sd行不是针对结果变量的；它表示模型错误。把真实的OUTVAR分数看作是模型预测的OUTVAR的总和，再加上一个正态分布的错误。然后，OUTVAR_sd是该误差项的后验估计。

effective_n是对每个变量链中独立样本数的启发式估计。这几乎总是小于标称数，因为连续的样本是相关的。有关一个简短的解释，请参见这篇博客文章。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55780397

复制

相似问题

问如何分析贝叶斯分析的这一结果
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何分析贝叶斯分析的这一结果EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何分析贝叶斯分析的这一结果
EN