首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >数据集中每个组的多变量时序分类

数据集中每个组的多变量时序分类
EN

Data Science用户
提问于 2022-07-23 10:38:13
回答 1查看 62关注 0票数 1

比方说,我有以下数据集:

代码语言:javascript
复制
station |    date   | min_temp | feature2 | feature3 | snow |
  1     |  01-11-11 |    1     |   5      |    22    | true |
  1     |  02-11-11 |    1     |   5      |    22    | true |
  2     |  01-11-11 |    1     |   5      |    22    | true |
  2     |  02-11-11 |    1     |   5      |    22    | true |

我想预测数据集中的每个站点是否会在接下来的日期下雪,我不确定什么是最好的方法。

  1. 将数据集拆分为多个有关站点的数据集。对我来说,这似乎不是一个好的解决方案,因为我将基本训练n数据集的模型。(每个电台)
  2. 包括站作为一个热编码的虚拟变量来使用它们作为分类器的特征,我不确定这一个。我将增加列(特性)的数量,从而增加维度。此外,我如何在最后作出预测?只是预测一天的特征?
  3. 就像训练一样,希望模型能了解到车站之间的区别。再说一遍,我如何在最后做出预测?

我不知道什么是完成这项任务的最佳方式。还有其他更好的方法吗?

EN

回答 1

Data Science用户

发布于 2022-07-25 15:11:35

使用随机森林分类器,然后使用随机搜索交叉验证优化参数。验证将告诉模型如何处理未知数据。https://towardsdatascience.com/hyperparameter-tuning-the-random-forest-in-python-using-scikit-learn-28d2aa77dd74

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/112895

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档