最近,我遇到了一个基于时间序列的数据集,其中包含了呼叫中心性能数据。该数据集包含客户针对每个日期进行的呼叫次数的信息,这是进一步按区域划分的。
Time Region Number of Calls
2018-03-01 X 1245
2018-03-02 Y 1390手头的任务是预测呼叫中心的总体性能,以及预测每个区域在未来3个月的表现,看看哪些区域的表现优于其他区域。我有一个数据集,日期是从2017年6月到现在。
发布于 2019-04-10 21:36:03
此数据集约为每个区域700行,对吗?假设您有5个区域,即3500个样本。当然,这不是一个大的数据集,但是您可以尝试在它上执行预测模型,因为它也不小。如果模型相对简单,您的模型可能能够运行它。在DS中,知道什么会起作用的唯一方法是尝试或者让已经尝试过的人说它起作用,或者它不起作用。
的任务
regions,您拥有的数据甚至更少,但是仍然可以以相同的方式执行它,并且您可能可以从所有区域的一般模型中获得这一好处。
您唯一的挑战是将该区域编码成一种可以用于ARIMA、NNs或其他回归模型的方法。
也许来自该区域的数据比该区域本身更适合于一个肤浅的模型(例如雇主人数、人口规模、技术进步水平等)。
https://datascience.stackexchange.com/questions/49072
复制相似问题