我有一个日期列,我的日期以季度/YY格式: 2Q96,3Q96,直到1Q22。当我使用to_datetime将其转换为标准格式YYYY DD时,熊猫错误地将年数转换为2096,2097年,而不是1996年、1997年。我可以编写几行代码来转换2096年、2097年到1996年、1997年等。我想知道是否有一个优雅的解决方案可以告诉to_datetime正确地识别年份范围。
发布于 2022-06-30 18:30:47
不幸的是,pd.to_datetime确实支持一年只有2位数的枢轴年。您可以使用自定义函数来转换它:
# 60 is used as pivot year: below -> 20XX, above -> 19XX
to_year4 = lambda x: f"{19 if int(x[-2:]) >= 60 else 20}{x[-2:]}-Q{x[0]}"
df['D'] = pd.to_datetime(df['Q'].apply(to_year4))
print(df)
# Output
Q D
0 2Q96 1996-04-01
1 3Q96 1996-07-01
2 1Q22 2022-01-01https://stackoverflow.com/questions/72819974
复制相似问题