如何使用tsfresh选择时间序列数据集的前n项功能?我能决定我想要提取的顶级特征的数量吗?
发布于 2021-07-14 12:01:10
您可以使用to关联表来解决这个问题。在你用you提取你的特征之后:
from tsfresh.examples import load_robot_execution_failures
from tsfresh import extract_features, select_features
from tsfresh.feature_selection.relevance import calculate_relevance_table
y = pd.Series(data = extracted_features['class'], index=extracted_features.index)
relevance_table = calculate_relevance_table(features2, y)
relevance_table = relevance_table[relevance_table.relevant]
relevance_table.sort_values("p_value", inplace=True)
best_features = relevance_table.copy()
best_features.sort_values(by=['p_value'])
best_features从现在开始,您唯一需要做的事情就是选择最前面的n个特性。只要在熊猫的帮助下选择第一排就行了。
https://datascience.stackexchange.com/questions/86419
复制相似问题