我创建了一个ML模型来分类5个IoT信号(比如A、B、C、D和E)。每个信号在抽样时间戳中都有一个值。
我的问题(怀疑)是:
在培训期间,我将每日时间戳上的值除以(例如,一天中每个信号的值为5000 )。所以,我的时间序列是每日基准时间戳。我已经完成了培训,测试数据集和交叉验证的结果是可以接受的。然而,我不想在数据获取团队的方向上犯错误。
发布于 2022-11-12 09:03:18
将时间序列应用于物联网可能非常复杂,因为您必须处理模型约束(一般情况下,它不能处理太多的数据)、业务约束(您想要预测什么以及使用哪种精度),以及设备约束(传感器可能有不同的校准,并且组件不是100%相同的)。
因此,第一步将是定义一个50到200步之间的时间范围,明确的开始和结束的时间限制,理想情况下,对应于一个周期。
我建议从简单的业务目标开始,因为由于模型和设备,您已经有了很多复杂性。它也适用于设备:开始研究一个设备可以更有效地理解主要行为,并逐步添加更多的设备。
那么你必须选择正确的模式。随机森林是相当普遍的,可以考虑多个变量。
https://pyts.readthedocs.io/en/latest/generated/pyts.classification.TimeSeriesForest.html
LSTM是很好的学习模式,但他们是相当敏感的噪音。您可能必须非常了解您的设备,以正确地平滑他们的信号。
https://www.analyticsvidhya.com/blog/2019/01/introduction-time-series-classification/
https://www.kaggle.com/code/meaninglesslives/simple-neural-net-for-time-series-classification
Sktime可能很有趣:https://www.sktime.org/en/v0.9.0/examples/02_分类_univariate.html
请注意,如果分类规则适用于任何IoT,则它不是多变量情况,而是适用于任何类似设备的模式识别。但是,请注意,这些设备应该具有足够的可比性,以便进行良好的分类(=数据规范化和可能的降噪)。
https://datascience.stackexchange.com/questions/116090
复制相似问题