首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >通过LSTM或XGBoost进行预测.真的是预告还是

通过LSTM或XGBoost进行预测.真的是预告还是
EN

Data Science用户
提问于 2019-09-30 12:18:12
回答 2查看 6.5K关注 0票数 4

我想我理解通过LSTM或XGBoost模型进行预测的想法,但我想联系社区来证实我的想法。

本教程很好地一步一步地解释了该做什么:"如何建立多步LSTM电力使用时间序列预测模型

然而,在预测方面,作者拿出了部分数据,然后用这些数据来预测未来的值.在我看来,这并不是一种预测(通过ARIMA、VAR等方法完成的事情--你可以指定时间周期的数目,然后不指定任何东西,模型给你一些关于未来的预测),你可以看到我对作者的评论,基本上,通过LSTM或XGBoost模型的预测将基于输入值而不是未来的数据范围,即我需要提供温度、湿度、风等来预测房屋的耗电量。

话虽如此,LSTM或GXBoost在何种程度上被用于预测?给出这些值,可以预测最终的结果是什么?因此,如果我需要在未来预测一些东西,而不知道其他的输入值,只需坚持传统的VAR模型?

通过查看这个@Fnguyen的问题/回答,“如果您有更多的输入变量,您需要一种方法来预测或推断这些变量,因为要进行预测,您的模型需要构建模型的所有输入。”似乎我应该用ARIMA来预测其他的输入值,然后再用LSTM。我想知道现在的预测是否如此准确,因为它依赖于ARIMA来预测LSTM输入的未来值,然后再依赖LSTM模型来做出最终的预测。再一次,准确的预测是相当复杂的事情,因为我们正在试图预测未来。

EN

回答 2

Data Science用户

发布于 2019-09-30 14:57:40

然而,在预测方面,作者拿出了部分数据,然后用这些数据来预测未来的值.在我看来,这并不是真正的预测(通过ARIMA、VAR等方法完成的事情--在这种情况下,您可以指定时间周期的数目,然后不指定任何其他内容,并且模型为您提供了一些对未来的预测)。

一般来说,我认为“预测”一词可以适用于目标是预测未来事件/值的任何问题。

您正在描述一个名为“单变量时间序列预测”的预测问题子类。在单变量时间序列预测的典型情况下,只利用目标变量的历史观测建立模型。ARIMA和VAR模型是解决这些问题的常用方法。(尽管这些模型几乎总是有多变量扩展。)

还有“多变量时间序列预测”,其中时间序列包含多个时间因变量,每个变量可能都依赖于其过去值和其他变量的过去/现在值。天气预报就是这种问题的一个很好的例子。

或XGBoost在多大程度上在预测中的应用

正如您正确地指出的那样,像XGBoost这样的模型只在目标的历史观察之外有其他输入的情况下才有用。(LSTM实际上可以与附加输入一起使用,也可以不带额外输入。)

很难说XGBoost或任何其他型号在工业中有多普遍,但是有一个漂亮 巨大的 正文 研究 关于外生输入的预测

我曾经做过一个项目,目标是预测太阳能农场的太阳辐照度。自然,太阳辐照度有很大的季节性变化。但是像云层、雾和温度这样的局部天气条件对辐照度也有很大的影响,所以单因素模型是不够的。

我们训练了XGBoost、随机森林、支持向量机和深度学习模型来预测未来的辐照度。这些模型的输入来自NOAA的一个数值天气模型,我认为这是一个非常普遍的方法。

如果我需要在未来预测一些东西,不知道其他的输入值,只需坚持传统的VAR模型?

是的,如果你没有任何关于其他变量的信息,那么你只能使用单变量时间序列方法。但是,即使你不知道其他投入100%的信心,你也能找到合理的预测,可以利用这些预测来建立一个更复杂的模型:)

票数 2
EN

Data Science用户

发布于 2021-02-19 22:12:12

答案将取决于域。然而,我的猜测是,如果你被限制在单变量方法,那么神经网络将击败XGBoost。作为一个数据点,我在一个包含数百个变量的多时间序列场景中成功地使用了XGBoost。

我建议你直接和两位模特对决,看看哪一位在你的情况下是赢家。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/61042

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档