我尝试使用主持人库来实现类内的Monte马尔可夫链,并使多处理模块工作,但在运行了这样的测试代码之后:
import numpy as np
import emcee
import scipy.optimize as op
# Choose the "true" parameters.
m_true = -0.9594
b_true = 4.294
f_true = 0.534
# Generate some synthetic data from the model.
N = 50
x = np.sort(10*np.random.rand(N))
yerr = 0.1+0.5*np.random.rand(N)
y = m_true*x+b_true
y += np.abs(f_true*y) * np.random.randn(N)
y += yerr * np.random.randn(N)
class modelfit():
def __init__(self):
self.x=x
self.y=y
self.yerr=yerr
self.m=-0.6
self.b=2.0
self.f=0.9
def get_results(self):
def func(a):
model=a[0]*self.x+a[1]
inv_sigma2 = 1.0/(self.yerr**2 + model**2*np.exp(2*a[2]))
return 0.5*(np.sum((self.y-model)**2*inv_sigma2 + np.log(inv_sigma2)))
result = op.minimize(func, [self.m, self.b, np.log(self.f)],options={'gtol': 1e-6, 'disp': True})
m_ml, b_ml, lnf_ml = result["x"]
return result["x"]
def lnprior(self,theta):
m, b, lnf = theta
if -5.0 < m < 0.5 and 0.0 < b < 10.0 and -10.0 < lnf < 1.0:
return 0.0
return -np.inf
def lnprob(self,theta):
lp = self.lnprior(theta)
likelihood=self.lnlike(theta)
if not np.isfinite(lp):
return -np.inf
return lp + likelihood
def lnlike(self,theta):
m, b, lnf = theta
model = m * self.x + b
inv_sigma2 = 1.0/(self.yerr**2 + model**2*np.exp(2*lnf))
return -0.5*(np.sum((self.y-model)**2*inv_sigma2 - np.log(inv_sigma2)))
def run_mcmc(self,nstep):
ndim, nwalkers = 3, 100
pos = [self.get_results() + 1e-4*np.random.randn(ndim) for i in range(nwalkers)]
self.sampler = emcee.EnsembleSampler(nwalkers, ndim, self.lnprob,threads=10)
self.sampler.run_mcmc(pos, nstep)
test=modelfit()
test.x=x
test.y=y
test.yerr=yerr
test.get_results()
test.run_mcmc(5000)我收到了一条错误消息:
File "MCMC_model.py", line 157, in run_mcmc
self.sampler.run_mcmc(theta0, nstep)
File "build/bdist.linux-x86_64/egg/emcee/sampler.py", line 157, in run_mcmc
File "build/bdist.linux-x86_64/egg/emcee/ensemble.py", line 198, in sample
File "build/bdist.linux-x86_64/egg/emcee/ensemble.py", line 382, in _get_lnprob
File "build/bdist.linux-x86_64/egg/emcee/interruptible_pool.py", line 94, in map
File "/vol/aibn84/data2/zahra/anaconda/lib/python2.7/multiprocessing/pool.py", line 558, in get
raise self._value
cPickle.PicklingError: Can't pickle <type 'instancemethod'>: attribute lookup __builtin__.instancemethod failed我认为这与我如何在类中使用有关,但我不知道如何保持类的结构不变,同时又如何使用多处理?!!
如有任何建议,我将不胜感激。
我必须提到,如果从最后一个函数中删除threads=10,代码就能很好地工作。
发布于 2015-03-29 12:24:09
有许多这样的问题可以讨论到底发生了什么:
…包括这个,这似乎是你的回应,…对于几乎相同的问题:
但是,这里的不同之处在于,您不是直接使用multiprocessing,而是使用emcee。因此,pathos.multiprocessing解决方案(来自上述链接)对您不可用。由于emcee使用cPickle,所以您必须坚持pickle知道如何序列化的东西。在类实例方面,您运气不佳。典型的解决方法是要么使用copy_reg注册要序列化的对象的类型,要么添加一个__reduce__方法来告诉python如何序列化它。您可以从上面的链接中看到几个类似的问题--…但是,没有一种方法能让你保持全班的写作方式。
发布于 2016-01-17 20:53:51
对于记录,您现在可以创建一个pathos.multiprocessing池,并使用pool参数将其传递给emcee。然而,请注意,多处理的开销实际上可以减缓事情的速度,除非您的可能性特别耗时计算。
https://stackoverflow.com/questions/29320466
复制相似问题