比方说,我有以下数据集:
station | date | min_temp | feature2 | feature3 | snow |
1 | 01-11-11 | 1 | 5 | 22 | true |
1 | 02-11-11 | 1 | 5 | 22 | true |
2 | 01-11-11 | 1 | 5 | 22 | true |
2 | 02-11-11 | 1 | 5 | 22 | true |我想预测数据集中的每个站点是否会在接下来的日期下雪,我不确定什么是最好的方法。
n数据集的模型。(每个电台)我不知道什么是完成这项任务的最佳方式。还有其他更好的方法吗?
发布于 2022-07-25 15:11:35
使用随机森林分类器,然后使用随机搜索交叉验证优化参数。验证将告诉模型如何处理未知数据。https://towardsdatascience.com/hyperparameter-tuning-the-random-forest-in-python-using-scikit-learn-28d2aa77dd74
https://datascience.stackexchange.com/questions/112895
复制相似问题