首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python,从时间序列中提取特性(TSFRESH包或我可以使用什么?)

Python,从时间序列中提取特性(TSFRESH包或我可以使用什么?)
EN

Stack Overflow用户
提问于 2020-12-14 10:21:23
回答 1查看 1K关注 0票数 0

我需要一些帮助,在时间序列中的特征提取,也许使用TSFRESH软件包。

我有大约5000个CSV文件,每个文件都是一个时间序列(它们的长度可能不同)。CSV-时间系列非常直截了当:

CSV-时间序列文件的示例:日期:1/1904 01:00:00,464844E-3连1/1/1904 01:00:00:01:001,000000 1,953125E-3 :00:01/1/1904 01:00:02,000000 4,882813E-4分部1/1/1901:00:00:03,000000-2,441406E -2,441406E-3区1/1/1901:00:00:00004,000-9,7625 E-4.

除了这些CSV文件之外,我还拥有一个元数据文件( CSV格式),其中每行引用这5000 CSV时间序列中的一个,并报告关于该时间序列的更多一般信息,如能量等。

元数据-CSV文件的例子:CSV的CSV-timeseries Porosity (孔隙率).,.,.

最重要的一栏是“标签”一栏,因为它报告一个CSV-时间序列是否标记为:

  1. 好的
  2. 坏的

我也应该考虑能量,渗透和孔隙度列,因为这些值在时间序列的标记中起着很大的作用。(我已经尝试了一种决策树,只看特征,现在我想分析时间序列来提取知识)

我打算从时间序列中提取特征,这样我就可以理解哪些特征使一个时间序列被标记为“好”或“坏”。

我怎么能用TSFRESH做这件事?还有其他方法吗?

你能告诉我怎么做吗?谢谢您:)

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-12-20 21:52:45

我现在也在做类似的事情,这个例子来自github的jupyter笔记本帮助了我。

简单来说,基本程序是:

  1. 以可接受的格式带来时间序列,有关更多信息,请参见the文献
  2. 使用X = extract_features(...)从时间序列中提取特征
  3. 使用X_filtered = select_features(X, y)选择相关的特性,y作为标签,好的或坏的,例如1和0。
  4. 将选择的特性放入分类器中,也显示在jupyter笔记本中。
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65287271

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档