我需要一些帮助,在时间序列中的特征提取,也许使用TSFRESH软件包。
我有大约5000个CSV文件,每个文件都是一个时间序列(它们的长度可能不同)。CSV-时间系列非常直截了当:
CSV-时间序列文件的示例:日期:1/1904 01:00:00,464844E-3连1/1/1904 01:00:00:01:001,000000 1,953125E-3 :00:01/1/1904 01:00:02,000000 4,882813E-4分部1/1/1901:00:00:03,000000-2,441406E -2,441406E-3区1/1/1901:00:00:00004,000-9,7625 E-4.
除了这些CSV文件之外,我还拥有一个元数据文件( CSV格式),其中每行引用这5000 CSV时间序列中的一个,并报告关于该时间序列的更多一般信息,如能量等。
元数据-CSV文件的例子:CSV的CSV-timeseries Porosity (孔隙率).,.,.
最重要的一栏是“标签”一栏,因为它报告一个CSV-时间序列是否标记为:
我也应该考虑能量,渗透和孔隙度列,因为这些值在时间序列的标记中起着很大的作用。(我已经尝试了一种决策树,只看特征,现在我想分析时间序列来提取知识)
我打算从时间序列中提取特征,这样我就可以理解哪些特征使一个时间序列被标记为“好”或“坏”。
我怎么能用TSFRESH做这件事?还有其他方法吗?
你能告诉我怎么做吗?谢谢您:)
发布于 2020-12-20 21:52:45
我现在也在做类似的事情,这个例子来自github的jupyter笔记本帮助了我。
简单来说,基本程序是:
X = extract_features(...)从时间序列中提取特征X_filtered = select_features(X, y)选择相关的特性,y作为标签,好的或坏的,例如1和0。https://stackoverflow.com/questions/65287271
复制相似问题