文章/答案/技术大牛

发布

社区首页 >问答首页 >数据集中每个组的多变量时序分类

问数据集中每个组的多变量时序分类
EN

Data Science用户

提问于 2022-07-23 10:38:13

回答 1查看 62关注 0票数 1

比方说，我有以下数据集：

station |    date   | min_temp | feature2 | feature3 | snow |
  1     |  01-11-11 |    1     |   5      |    22    | true |
  1     |  02-11-11 |    1     |   5      |    22    | true |
  2     |  01-11-11 |    1     |   5      |    22    | true |
  2     |  02-11-11 |    1     |   5      |    22    | true |

我想预测数据集中的每个站点是否会在接下来的日期下雪，我不确定什么是最好的方法。

将数据集拆分为多个有关站点的数据集。对我来说，这似乎不是一个好的解决方案，因为我将基本训练n数据集的模型。(每个电台)
包括站作为一个热编码的虚拟变量来使用它们作为分类器的特征，我不确定这一个。我将增加列(特性)的数量，从而增加维度。此外，我如何在最后作出预测？只是预测一天的特征？
就像训练一样，希望模型能了解到车站之间的区别。再说一遍，我如何在最后做出预测？

我不知道什么是完成这项任务的最佳方式。还有其他更好的方法吗？

forecasting

time-series

lstm

rnn

multiclass-classification

回答 1

Data Science用户

发布于 2022-07-25 15:11:35

使用随机森林分类器，然后使用随机搜索交叉验证优化参数。验证将告诉模型如何处理未知数据。https://towardsdatascience.com/hyperparameter-tuning-the-random-forest-in-python-using-scikit-learn-28d2aa77dd74

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/112895

复制

相似问题

问数据集中每个组的多变量时序分类
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据集中每个组的多变量时序分类EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据集中每个组的多变量时序分类
EN