我目前正在对爱荷华州艾姆斯数据集中的房价进行一些分析。我已经成功地对数据进行了斗争,并删除了所有缺失的值等等,我准备做一些回归分析。我想要建立三个回归模型,第一个有两个最好的特性,第二个有15个特征,第三个有所有可用变量。我正在使用SelectKBest来进行特性选择。我的目标变量是我日志转换的'SalePrice‘。出于某种原因,我总是从SelectKBest那里得到一个值错误。有趣的是,如果我不记录-转换'SalePrice',一切正常。我检查了我的目标变量和ist的dtype,就像预期的那样,浮动。
有人能帮帮我吗?
我会很感激的!

发布于 2018-09-06 08:10:12
你在用
SelectKBest(chi2)根据chi2
参数:
X:{阵列样,稀疏矩阵},形状= (n_samples,n_features_in)样本向量.Y:数组样,shape = (n_samples,)目标向量(类标签)。
chi2只适用于分类任务,而不是回归。你目前预测销售价格的问题是一个倒退的任务,因此出现了错误。
也许可以试试f_regression来代替chi2
https://stackoverflow.com/questions/52185337
复制相似问题