文章/答案/技术大牛

发布

社区首页 >问答首页 >从狄利克雷分布抽样的PyMC中的FloatingPointError

问从狄利克雷分布抽样的PyMC中的FloatingPointError
EN

Stack Overflow用户

提问于 2013-10-18 02:46:54

回答 3查看 783关注 0票数 27

在being unsuccessful in using decorators定义了“指数随机变量的对数”的随机对象之后，我决定使用pymc.stochastic_from_dist手动编写这个新分布的代码。我尝试实现的模型可以在这里获得(第一个模型)：

现在，当我尝试使用MCMC Metropolis对log(alpha)进行采样时，并使用正态分布作为建议(如下图中所述的采样方法)，我得到了以下错误：

  File "/Library/Python/2.7/site-packages/pymc/distributions.py", line 980, in rdirichlet
    return (gammas[0]/gammas[0].sum())[:-1]

FloatingPointError: invalid value encountered in divide

虽然采样没有出错的次数，但采样直方图与本文的直方图是匹配的。我的分层模型是：

"""
A Hierarchical Bayesian Model for Bags of Marbles

logalpha ~ logarithm of an exponential distribution with parameter lambd
beta ~ Dirichlet([black and white ball proportions]:vector of 1's)
theta ~ Dirichlet(alpha*beta(vector))

"""

import numpy as np
import pymc
from scipy.stats import expon
lambd=1.
__all__=['alpha','beta','theta','logalpha']
#------------------------------------------------------------
# Set up pyMC model: logExponential
# 1 parameter: (alpha)

def logExp_like(x,explambda):
    """log-likelihood for logExponential"""
    return -lambd*np.exp(x)+x
def rlogexp(explambda, size=None):
    """random variable from logExponential"""
    sample=np.random.exponential(explambda,size)
    logSample=np.log(sample)
    return logSample
logExponential=pymc.stochastic_from_dist('logExponential',logp=logExp_like,
                                          random=rlogexp,
                                          dtype=np.float,
                                          mv=False)
#------------------------------------------------------------
#Defining model parameteres alpha and beta.
beta=pymc.Dirichlet('beta',theta=[1,1])
logalpha=logExponential('logalpha',lambd)

@pymc.deterministic(plot=False)
def multipar(a=logalpha,b=beta):
    out=np.empty(2)
    out[0]=(np.exp(a)*b)
    out[1]=(np.exp(a)*(1-b))
    return out
theta=pymc.Dirichlet('theta',theta=multipar)

我的测试采样代码是：

from pymc import Metropolis
from pymc import MCMC
from matplotlib import pyplot as plt
import HBM
import numpy as np
import pymc
import scipy
M=MCMC(HBM)
M.use_step_method(Metropolis,HBM.logalpha, proposal_sd=1.,proposal_distribution='Normal')
M.sample(iter=1000,burn=200)

当我在distributions.py的978行检查传递给伽马分布的θ的值时，我看到值不是零，而是小的值！所以我不知道如何防止这个浮点错误？

python

random

floating-point

sampling

pymc

回答 3

Stack Overflow用户

发布于 2020-07-02 12:37:43

我在他们的文档中找到了这个nugget：

随机变量截止值不能小于D的最大元素，否则D的密度为零。标准的Metropolis step方法可以毫无问题地处理这种情况；它偶尔会提出非法的值，但这些值将被拒绝。

这会让我相信dtype=np.float (它与float具有相同的范围)可能不是你想要的方法。文档说它需要是一个numpy数据类型，但它只需要是一个可以转换为numpy数据类型对象的数据类型，并且在Python2 (如果我错了，请纠正我) number数据类型是固定大小的类型，这意味着它们是相同的。也许使用Decimal模块将是一种选择。通过这种方式，您可以设置精度级别以封装期望值范围，并将其传递给扩展的随机方法，在那里它将被转换。

from decimal import Decimal, getcontext
getcontext().prec = 15
dtype=Decimal

我不知道一旦numpy库掌握了它，它就不会被截断，或者它是否会尊重继承的精度级别。我没有准确的方法来测试这一点，但尝试一下，让我知道它是如何为你工作的。

编辑：我测试了精确继承的概念，它似乎是成立的：

>>> from decimal import Decimal, getcontext
>>> getcontext().prec = 10
>>> Decimal(1) / Decimal(7)
Decimal('0.1428571429')
>>> np.float(Decimal(1) / Decimal(7))
0.1428571429
>>> getcontext().prec = 15
>>> np.float(Decimal(1) / Decimal(7))
0.142857142857143
>>>

票数 1

Stack Overflow用户

发布于 2013-10-29 01:20:45

如果你得到的数字很小，那么对于一个浮点数来说，它可能太小了。这通常也是对数要避免的。如果你使用dtype=np.float64怎么办？

票数 0

Stack Overflow用户

发布于 2020-03-31 06:50:07

正如您在问题末尾所建议的那样，问题出在浮点类型转换为0的数字太小。一种解决方案可能是稍微调整源代码，并将除法替换为np.divide和"where“条件中的除法，以便为给定阈值添加一些显式的转换为较小的值。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/19434726

复制

相似问题

问从狄利克雷分布抽样的PyMC中的FloatingPointError
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从狄利克雷分布抽样的PyMC中的FloatingPointErrorEN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从狄利克雷分布抽样的PyMC中的FloatingPointError
EN