文章/答案/技术大牛

发布

社区首页 >问答首页 >回归模型的数据准备

问回归模型的数据准备
EN

Data Science用户

提问于 2018-03-21 05:29:13

回答 1查看 58关注 0票数 0

嗨，我目前正试图预测一件商品在我的商店中是否会成功，这意味着我的培训数据集包含了许多特性：

项目名称
项目重量
项目类别
原产国
项目销售总额
每家商店的商品销售
项目评级
项目价格

等等..。由于我将介绍一个新的项目出售，我对这个新项目知之甚少：

项目名称
项目重量
项目类别
原产国
项目价格

当我进行预测时，并不是所有的训练数据/测试数据中的特性都会出现。这在ML中正常吗？在这类情况下进行特性工程时，经验法则是什么？

dataset

prediction

training

回答 1

Data Science用户

回答已采纳

发布于 2018-03-21 09:35:57

通常，你只能用你训练过的变量来预测。但在这种情况下，我建议您检查这些缺失变量的多重共线性和您将拥有的变量。也许他们已经和你已经拥有的特性高度相关了。在这种情况下，您可以使用可用的特性进行建模。

如果情况不是这样，而且缺少的变量看起来像是回归中的一个重要变量，那么您可能需要选择一些其他变量，这些变量可以帮助您间接地获得缺少的特性。例如，“类别”可以帮助您准确地获得评级。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/29347

复制

相似问题

问回归模型的数据准备
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问回归模型的数据准备EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问回归模型的数据准备
EN