有人对我如何使用python +时间序列或ML (推荐的技术,例如随机森林)来预测微软的收入有什么建议吗?(我有过去的收入和股价数据)。
发布于 2018-09-06 01:31:14
机器学习是一种强大的工具,但它不是一颗银弹,它可以从任何东西中预测任何东西。例如,我无法根据你所穿的衣服的数据来预测你明晚的晚餐(除非你是一个非常特别的人)。这是一个夸张,然而,你可以看到,为了作出一些预测,这是至关重要的,你的数据与你想要的目标。
预测模型一直存在。机器学习与分析预测模型的区别在于它引入了有效调整模型参数的算法。因此,我们现在可以使用比以前更多的功能来训练模型。
为了能够可靠地预测某些值,您的数据需要嵌入与该值相关的信息。例如,如果您的所有特性都不包含与预测目标相关的信息,那么无论您的模型多么强大,它都无法可靠地预测目标。此外,一个非常嘈杂的目标值将要求你有更多的数据。
这正是股票的情况,一个股票的价格并不仅仅取决于收入。事实上,收入对股票价格的影响很小。因此,您不能期望使用这种低信息特性可靠地确定目标预测值。
为了预测股票价格,你需要更多的数据,以下是一些好的启动特性:
你可以获得真正的创造性与功能。例如,股票预测模型通常使用每日新闻文章中的情绪分析。
发布于 2018-09-06 12:26:27
@JahKnows的答案很好地解释了相关特性的重要性。我想详细说明可以探讨解决这一问题的技术。
有一些强大的时间序列和机器学习技术可以用来解决手头的问题。这个问题有一定的时间成分。你所拥有的数据将是自相关。前-本年度的收入将与过去一年的收入相关联.
有没有人建议我如何使用python +时间序列或ML (推荐的技术,例如随机森林)来预测Microsofts的收入。
就建议而言,它们将完全取决于您拥有的数据类型。但是,正如您所描述的,我想从两种不同的技术流派:时间序列和机器学习中推荐问题。
时间序列:
假设您在数据集中有一些特性。您可以开发一个多变量时间序列模型。向量自回归模型已成功地应用于计量经济学领域。那肯定是可以借的。
机器学习:
近年来,递归神经网络在时间序列变量预测问题中得到了广泛的应用。作为RNN的一个变体,长期短期记忆(LSTM)已经被证明比简单的RNN更成功。
https://datascience.stackexchange.com/questions/37859
复制相似问题