我有一个数据集(房租价格与卧室和邻里的数量)。
我想要将租赁价格建模为基价、与卧室数量相关的标量和与邻里相关的标量的乘积。
例如,对于梅菲尔区的两张床,它可能是R= $100*1.2*1.5
从数学上讲,我猜这应该是这样的:租金=基数*(a1B1+a2B2+a3B3...)*(k1N1+k2N2+...)
其中,B2是一个二元变量,如果房产有两间卧室,则为1,否则为0;在上面的示例中,a2将为1.2;N1是二元变量,如果房产位于'Neighborhood 1',则为1,依此类推。
scikit-learn可以帮助模拟这样的事情吗?我可以对变量的线性组合进行建模:
价格= a1B1 + a2B2 + ... + k1N1 + k2N2
但我看不到任何方法来模拟乘法模型,也看不到任何方法来将带有分类变量的乘法模型转换为线性模型。
发布于 2017-10-24 18:05:14
这是一个简单的线性回归问题。房价回归是线性回归最著名的用例。您可以导入它:
from sklearn.linear_model import LinearRegression
linear_model = LinearRegression()
linear_model.fit(X_training, y_training)
# Where X = features that you can provide in a dataframe or numpy matrix
# y = House prices
prices = linear_model.predict(X_test)
# ^Gives the prediction for the priceshttps://stackoverflow.com/questions/46906036
复制相似问题