我目前正在为我的论文处理实验数据,在使用scipy curve_fit时遇到了一个问题。
背景
这是一项关于LED发射的研究,其模型描述了特定LED成分/波长的吸收光谱。
模型是这样的:

基本的想法是,我们得到了实验数据,我们想要拟合这个方程,给我们一个最好的猜测,数据的垂直移动是实验中使用的设备的结果。为了获得垂直移位,curve_fit中使用的函数将采用a + c * E * np.sqrt(E-bandE) * np.exp(-E*b)的形式。bandE/Eg指的是将在规范部分中提供的材料的带隙能量。E是指光子能量。
我做了什么
我在pandas数据框中使用的值,我将其保存为一个列表,供您复制和粘贴(如果您需要),
photon_energy = [1.1271378805005456, 1.1169834851807208, 1.1070104183487501, 1.0972138659739825, 1.0875891829391229, 1.0781318856961741, 1.0688376453022415, 1.0597022808124787, 1.0507217530089832, 1.0418921584458825, 1.0332097237921667, 1.0246708004550413, 1.016271859467705, 1.0080094866265041, 0.9998803778633872, 0.9918813348404801, 0.9840092607544446, 0.9762611563390552, 0.9686341160551564, 0.9611253244578295, 0.9537320527312309, 0.9464516553821375, 0.939281567083788, 0.9322192996621053, 0.9252624392168658, 0.918408643370815, 0.9116556386401471, 0.9050012179201461, 0.898443238080145, 0.8919796176623023, 0.885608334679, 0.8793274245039717, 0.8731349778525352, 0.8670291388465735, 0.8610081031601389, 0.8550701162417932, 0.8492134716100002, 0.8434365092180953, 0.8377376138855407, 0.8321152137923491, 0.8265677790337335]
s2c = 1.0711371944297785, 1.0231329828975677, 1.0994106908895496, 1.5121380434280387, 1.4362625879245816, 1.6793735384201034, 1.967376254925342, 2.718958670464331, 2.8657461347457933, 3.2265806746948247, 4.073118384895329, 5.002080377098846, 5.518310980392261, 6.779117609004787, 7.923629188601875, 9.543272102194026, 11.061716095291905, 12.837722885549315, 15.156654004011116, 17.604461138085984, 20.853321055852934, 24.79640344112394, 28.59835938028905, 32.5257456, 37.87676923906976, 42.15321400245093, 46.794297771521705, 56.44267690099888, 61.60473904566305, 70.99822229568558, 77.60736232076566, 84.37513036736146, 92.9038746946938, 107.54475674330527, 117.91910226690293, 137.67481655050688, 158.02001455302846, 176.37334256204952, 195.20886164268876, 215.87011902349641, 240.41535423461914]契合度
bandE = 0.7435616030790153
def exp_fit(E, a, b, c):
# return a + c * E * np.sqrt(E - bandE) * np.exp(-E/0.046)# Eg and k are already defined previously
return a + c * E * np.sqrt(E-bandE) * np.exp(-E*b)
E = np.linspace(np.min(new_df['Photon Energy']), np.max(new_df['Photon Energy']),1000)
popt, pcov = curve_fit(exp_fit, new_df['Photon Energy'], new_df['S2c'],maxfev = 10000, p0=[0,500/23,1e+9]) # best guess of a,b, and c value
plt.plot(new_df['Photon Energy'], new_df['S2c'], 'o', label='S2c')
plt.plot(new_df['Photon Energy'], exp_fit(new_df['Photon Energy'], *popt), '-', label='S2c fit')
plt.ylabel('Emission Intensity (a.u.)')
plt.xlabel('Photon Energy (eV)')
plt.yscale('log')
plt.legend()
plt.show()这就是我们最终得到的结果。

out: [1.59739310e+00 2.50268369e+01 9.55186101e+11]因此,在与我一起工作的人(我们对python或数据科学不是很了解)进行了长时间的讨论后,我们一致认为,除了a系数之外,所有的东西都拟合得很好(b实际上并不重要,因为它将在后面的步骤中显式计算出来)。C很重要,而且它似乎是正确的数量级)。因为它是垂直移位,所以我们希望a是一个常数,但由于它导致曲线发散。
问题所在
正如问题标题和前面的段落中所提到的,我们预计a大约是5e-4或在这个量级范围内,但我们得到的东西对于这个实验来说太大了。如果有人精通scipy的curve_fit特性,请帮助我们!
更多信息,我们过去使用的是OriginLab (一种更昂贵的微软excel),但它对于许可证来说非常昂贵,所以我们尝试使用python来代替。这种方法确实适用于OriginLab,并且不会导致拟合发散,因此我们认为这可能与curve_fit使用的算法有关。
发布于 2021-03-29 04:51:18
显然,这种麻烦是由于不方便的拟合标准造成的。
LMSE (最小均方误差)可能已经在你的软件中实现了。在数据延长了几十年的情况下,这不是一个好的拟合标准。
对于您的数据,建议使用LMSRE (最小均方相对误差)。
请看下面的结果比较。

注意:与从1到240的数据范围相比,a=0.0005的期望值是荒谬的。这将没有任何效果,就像a=0一样。可能是尺度或单位上的混乱?
https://stackoverflow.com/questions/66839107
复制相似问题