在statsmodels中,我在玩PP图,我想知道为什么将正态分布与比例为5和loc = 20的正态分布与标准正态分布进行比较时,在PP图上,当分布有很大不同时,会形成一条直线。请在下面找到示例代码:
import numpy as np
import statsmodels.api as sm
import pylab
test = np.random.normal(20, 5, 100000)
pp = sm.ProbPlot(test, loc=0, scale=1)
fig = pp.ppplot()
plt.show()

发布于 2022-04-06 21:02:43
您可以尝试减少样本大小,您将看到效果。
test = np.random.normal(20, 5, 100)
pp = sm.ProbPlot(test, loc=0, scale=1, fit=False).ppplot(line='45')
plt.show()如果fit是假的,则loc、scale和distargs传递给分发。如果fit为真,则dist的参数将使用dist.fit自动匹配。分位数是根据标准化数据,减去拟合的loc,除以拟合的标度后形成的。如果dist是SciPy冻结发行版,则无法使用fit。
https://stackoverflow.com/questions/55564688
复制相似问题