我的数据集有一个具有以下格式的时间戳列: 06/24/18 0:56我如何确切地将这些信息转换为可以用于逻辑回归等分类算法的特性?
发布于 2019-03-19 14:40:46
时间序列分类问题的一种常见方法是将连续的数据流划分为一定持续时间的样本。
这被称为滑动窗口分割。

您并不真正使用时间戳作为特性,因为它们在未见数据的分类过程中不会有用。想象一下,用2018年获得的数据训练一个模型,并试图对2019年的数据进行分类。这些信息不是在日期上,而是在其他特性的值上!
发布于 2019-03-19 15:50:20
欢迎来到现场!如果您发布您正在使用的语言,您将得到更好的答案,但我将假设python。您需要的最基本的事情之一是将其分解为组件。那么,假设您在熊猫数据栏中的专栏名为"client_date“。你可以用:
# Convert the date to something python understands
df['client_date'] = pd.to_datetime(df['client_date'])
# Get a year
df['client_year'] = df['client_date'].dt.year
# Get a month
df['client_year'] = df['client_date'].dt.month我认为你明白这个想法,这将帮助你开始剩下的研究。祝好运!
https://datascience.stackexchange.com/questions/47620
复制相似问题