首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >生产环境中的时间序列分类.疑问

生产环境中的时间序列分类.疑问
EN

Data Science用户
提问于 2022-11-11 14:10:24
回答 1查看 55关注 0票数 0

我创建了一个ML模型来分类5个IoT信号(比如A、B、C、D和E)。每个信号在抽样时间戳中都有一个值。

我的问题(怀疑)是:

  1. 我是否必须仅在相同的(在本例中为每日)时间戳上对生产中的新数据进行预处理;换句话说,每个时间序列样本的值(特性)数量与模型培训期间的值(特性)相同吗?我很确定这是真的,但我不知道时间序列是否有什么特定的东西。
  2. 由于我的数据是标准化和标准化的,关于时间序列长度的建议是什么,因为这对于生产环境中模型中输入数据的标准化很重要。

在培训期间,我将每日时间戳上的值除以(例如,一天中每个信号的值为5000 )。所以,我的时间序列是每日基准时间戳。我已经完成了培训,测试数据集和交叉验证的结果是可以接受的。然而,我不想在数据获取团队的方向上犯错误。

EN

回答 1

Data Science用户

回答已采纳

发布于 2022-11-12 09:03:18

将时间序列应用于物联网可能非常复杂,因为您必须处理模型约束(一般情况下,它不能处理太多的数据)、业务约束(您想要预测什么以及使用哪种精度),以及设备约束(传感器可能有不同的校准,并且组件不是100%相同的)。

因此,第一步将是定义一个50到200步之间的时间范围,明确的开始和结束的时间限制,理想情况下,对应于一个周期。

我建议从简单的业务目标开始,因为由于模型和设备,您已经有了很多复杂性。它也适用于设备:开始研究一个设备可以更有效地理解主要行为,并逐步添加更多的设备。

那么你必须选择正确的模式。随机森林是相当普遍的,可以考虑多个变量。

https://pyts.readthedocs.io/en/latest/generated/pyts.classification.TimeSeriesForest.html

LSTM是很好的学习模式,但他们是相当敏感的噪音。您可能必须非常了解您的设备,以正确地平滑他们的信号。

https://www.analyticsvidhya.com/blog/2019/01/introduction-time-series-classification/

https://www.kaggle.com/code/meaninglesslives/simple-neural-net-for-time-series-classification

Sktime可能很有趣:https://www.sktime.org/en/v0.9.0/examples/02_分类_univariate.html

请注意,如果分类规则适用于任何IoT,则它不是多变量情况,而是适用于任何类似设备的模式识别。但是,请注意,这些设备应该具有足够的可比性,以便进行良好的分类(=数据规范化和可能的降噪)。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/116090

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档