新手尝试我的第一个负二项回归。谷歌Colab上的iPython。我将数据集作为pandas df加载。下面公式中的特征(和目标)都出现在df (我将其命名为"dataset")中。
我还带来了
from patsy import dmatrices
import statsmodels.api as sm但是,当我
formula = """Target ~ MeanAge + %White + %HHsNotWater + HHsIneq*10 + %NotSaLang + %male + %Informal + COGTACatG2B09 + %Poor + AGRating """
data = dataset
response, predictors = dmatrices(formula, data, return_type='dataframe')
nb_results = sm.GLM(response, predictors, family=sm.families.NegativeBinomial(alpha=0.15)).fit()
print(nb_results.summary())我简单地得到了响应,还有一个指向第四行的箭头(以“AssertionError:”开头的那一行)。我不知道如何解决这个问题,在这个网站上也找不到类似的问题--有什么明智的建议吗?
发布于 2019-06-12 16:16:13
我犯的...the错误是在公式行中。Python将我的特性名称中的"%“和"*”视为完全不同的指令。
因此,将每个功能从HHsHotWater更改为Q('HHsNotWater')等,就产生了所有的差异。@njsmith在pydata/patsy问题上,github纠正了我。
https://stackoverflow.com/questions/56546170
复制相似问题