我有一个很大的“时间序列”数据集,如下所示:
Date Day of the week Days Since last Happy Out of town Happy
1/1/20 Monday 0 1 1
1/2/20 Tuesday 1 0 0
1/3/20 Wednesday 2 0 0
1/4/20 Thursday 0 0 1我想根据之前的观察结果预测未来几天的“快乐”观察结果。我直观地知道这些输入变量之间存在相关性(例如一周中的某一天、自上次快乐观察以来的天数等),但我想知道这些输入变量与“快乐”观察之间的相关性有多强。
我应该使用什么建模技术?毒药?马尔可夫链?线性回归?
发布于 2020-05-11 13:59:20
你问的问题,“如何预测”,这是整个机器学习领域的主要问题,所以我们不能为你回答。如果你想要一些简单的模型开始,你可以使用sklearn包中的模型,如Decision Tree或KNN。
如果你想了解变量之间的相关性,你可以使用DataFrame.corr(method='pearson')来获得相关矩阵。
发布于 2020-05-12 14:02:26
双向变分自动编码器,就像GPT-2中使用的那样
https://stackoverflow.com/questions/61723155
复制相似问题