目标:
我想对以下二手车价格数据使用线性回归来预测汽车价格:

My Procedure:
我有一个热编码的'Make‘和'Type',并将这些列添加回:

然后,我对我的预测器列使用了标准标量:

My模型:
我使用OLS (在添加了一个常量之后)来获得系数:

问题:使用这个如何预测,例如:一辆凯迪拉克轿车,皮具6缸和45000英里?
我熟悉使用ss.transform来获取缩放值,然后我可以将这些值输入model_OLS.predict来预测汽车价格。我猜我不能选择我想要用来预测价格的特征吗?我得把他们都说出来?
发布于 2021-07-10 20:38:03
如果你已经在所有的特征上拟合了OLS模型,那么用有限的特征做预测就没有多大意义了。您也许可以选择系数(const + 1*Make_Cadillac +1*皮革+6*柱面)进行自定义预测,或者您可以根据您想要用于预测的特性重新拟合模型,也许可以用一个函数来简化它。
vals = {'Make_Cadillac': 1, 'Leather': 1, 'Cylinder': 6} # populate scaled values instead or transform them in the function
def make_prediction(X, y, vals):
OLS = sm.OLS(y, X[[*vals]]).fit()
# scale input values #
return OLS.predict([*vals.values()])
print(make_prediction(X, y, vals))https://stackoverflow.com/questions/68331015
复制相似问题