我有两个月的空气污染测量数据,以确定感兴趣的地点。我非常有兴趣使用机器学习算法来预测同一地点的污染(比如说,在接下来的两个月里)。
由于空气污染是一个地理问题,利用机器学习在单一地点应用和预测污染有意义吗?有人能解释一下这件事的利弊吗?
发布于 2020-06-24 21:17:31
没有足够的业力来简单的评论,所以我必须记录这作为一个答案。
说得通吗?好的!但是请记住,如果您在单个位置上训练您的模型,那么它只能被信任用于来自同一位置的未来数据。你的模型可以推广到其他地方吗?也许吧,但你的模特什么都没看到所以你不能确定。同样的情况也适用于只有2个月的数据。你不能确定这个模型是否准确,因为它是一个月来从未见过的评分数据。
如果您真的想解决这类问题,而只是没有它的数据- 此链接有一个类似的数据集,您可能会感兴趣。
发布于 2020-06-23 18:22:14
Imho只有2个月的数据,一个大问题是季节性:污染在很大程度上取决于温度和风条件,因此为了准确预测污染程度,你需要至少一年的数据,最好是过去几年的数据。我不认为你能用两个月的训练数据提前两个月准确地预测污染水平。
也许您可以尝试使问题变得更广泛:使用包含多个城市的数据集,其中包含数年的数据,然后您可以尝试使用表示密度、温度等当地条件的特征来预测特定位置的污染水平。
https://datascience.stackexchange.com/questions/76466
复制相似问题