首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >scipy智能优化

scipy智能优化
EN

Stack Overflow用户
提问于 2010-06-22 23:30:31
回答 2查看 895关注 0票数 0

我需要用直线拟合不同数据集中的一些点。从每个数据集中我想要拟合一条线。所以我得到了描述I线的参数ai和bi : ai + bi*x,问题是我想强制每个ai是相等的,因为我想要相同的截距。我在这里找到了一个教程:http://www.scipy.org/Cookbook/FittingData#head-a44b49d57cf0165300f765e8f1b011876776502f。不同的是,我不知道我有多少个数据集。我的代码是:

代码语言:javascript
复制
from numpy import *
from scipy import optimize

# here I have 3 dataset, but in general I don't know how many dataset are they
ypoints = [array([0, 2.1, 2.4]),    # first dataset, 3 points
           array([0.1, 2.1, 2.9]),  # second dataset
           array([-0.1, 1.4])]      # only 2 points

xpoints = [array([0, 2, 2.5]),      # first dataset
           array([0, 2, 3]),        # second, also x coordinates are different
           array([0, 1.5])]         # the first coordinate is always 0

fitfunc = lambda a, b, x: a + b * x
errfunc = lambda p, xs, ys: array([ yi - fitfunc(p[0], p[i+1], xi) 
                                    for i, (xi,yi) in enumerate(zip(xs, ys)) ])


p_arrays = [r_[0.]] * len(xpoints)
pinit = r_[[ypoints[0][0]] + p_arrays]
fit_parameters, success = optimize.leastsq(errfunc, pinit, args = (xpoints, ypoints))

我得到了

代码语言:javascript
复制
Traceback (most recent call last):
  File "prova.py", line 19, in <module>
    fit_parameters, success = optimize.leastsq(errfunc, pinit, args = (xpoints,    ypoints))
  File "/usr/lib64/python2.6/site-packages/scipy/optimize/minpack.py", line 266, in  leastsq
    m = check_func(func,x0,args,n)[0]
  File "/usr/lib64/python2.6/site-packages/scipy/optimize/minpack.py", line 12, in  check_func
    res = atleast_1d(thefunc(*((x0[:numinputs],)+args)))
  File "prova.py", line 14, in <lambda>
    for i, (xi,yi) in enumerate(zip(xs, ys)) ])
ValueError: setting an array element with a sequence.
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2010-06-28 08:05:29

如果您只需要线性拟合,那么最好使用线性回归来估计它,而不是使用非线性优化器。使用scikits.statsmodels可以获得更多的fit统计信息。

代码语言:javascript
复制
import numpy as np
from numpy import array

ypoints = np.r_[array([0, 2.1, 2.4]),    # first dataset, 3 points
           array([0.1, 2.1, 2.9]),  # second dataset
           array([-0.1, 1.4])]      # only 2 points

xpoints = [array([0, 2, 2.5]),      # first dataset
           array([0, 2, 3]),        # second, also x coordinates are different
           array([0, 1.5])]         # the first coordinate is always 0

xp = np.hstack(xpoints)
indicator = []
for i,a in enumerate(xpoints):
    indicator.extend([i]*len(a))

indicator = np.array(indicator)


x = xp[:,None]*(indicator[:,None]==np.arange(3)).astype(int)
x = np.hstack((np.ones((xp.shape[0],1)),x))

print np.dot(np.linalg.pinv(x), ypoints)
# [ 0.01947973  0.98656987  0.98481549  0.92034684]

回归矩阵具有共同的截距,但每个数据集具有不同的列:

代码语言:javascript
复制
>>> x
array([[ 1. ,  0. ,  0. ,  0. ],
       [ 1. ,  2. ,  0. ,  0. ],
       [ 1. ,  2.5,  0. ,  0. ],
       [ 1. ,  0. ,  0. ,  0. ],
       [ 1. ,  0. ,  2. ,  0. ],
       [ 1. ,  0. ,  3. ,  0. ],
       [ 1. ,  0. ,  0. ,  0. ],
       [ 1. ,  0. ,  0. ,  1.5]])
票数 1
EN

Stack Overflow用户

发布于 2010-06-23 00:07:26

(附注:使用def,而不是分配给名称的lambda --这非常愚蠢,而且只有缺点,lambda唯一的用途是使匿名函数!)。

您的errfunc应该返回一个浮点数序列(数组或其他数组),但事实并非如此,因为您试图将每个y点的差值数组作为数组的项(记住,ypoints又名ys是一个数组列表!)以及拟合函数的结果。因此,您需要将表达式yi - fitfunc(p[0], p[i+1], xi)“折叠”为一个浮点数,例如norm(yi - fitfunc(p[0], p[i+1], xi))

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3094624

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档