tsfresh需要特定列中的输入数据。我最初假设column_id只是row_index,但我担心这是错误的。
我有传感器数据-压力传感器,温度传感器和湿度传感器被捕获的时间间隔为10秒。因此,它是4列pandas DataFrame。现在告诉我应该如何使用这些数据?什么是column id?
文档是很好的here,只是我不能理解他们所说的entity是什么意思。每个传感器测量一个不同的东西,所有的都安装在一个机器单元中。
发布于 2018-08-19 05:45:50
源代码揭示了这个密文:
tsfresh/feature_extraction/extraction.py:76
:param column_id: The name of the id column to group by.
:type column_id: str因此,对于时间序列中的所有点,这是一个应该具有相同值的列。如果数据帧中的这一列中有多个值,则库会将其解释为多个时间序列,并同时对其进行分析。
发布于 2019-06-21 00:53:32
此列指示时间序列所属的实体。将分别为每个实体提取特征。得到的特征矩阵将为每个实体包含一行。在文档中提出的示例中,您拥有不同机器人在不同时间的6个传感器的值。在本例中,每个机器人都是一个不同的实体,因此每个机器人都有一个不同的id。
或者,如果您有不同供应商的数据以及他们在不同时间戳在不同类别中销售的商品数量,则可以将供应商id用作您的"column_id“。
https://stackoverflow.com/questions/51912461
复制相似问题