在包含327条记录的数据集中,我有两列:
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 JD 327 non-null datetime64[ns]
1 CD 312 non-null Int64我还想生成第三个参数(['theoretical_eoc']),它给出了保存在[JD]中的日期加上[CD]中指定的月份数。但是当我使用以下命令定义这个新列时:
df['theoretical_eoc'] = turnover.apply(lambda x: x.JD + relativedelta(months=x.CD), axis=1)我收到以下错误消息:
TypeError: int() argument must be a string, a bytes-like object or a number, not 'NAType'因此,我定义了一个函数,用于在任何列中的某个值是NA的情况下放置NaT:
def rd_na(a, b):
if pd.isnull(a) or pd.isnull(b):
pd.NaT
else:
a + relativedelta(months = b)但是当我使用它的时候:
df['theoretical_eoc'] = turnover.apply(lambda x: rd_na(x.JD, x.CD), axis=1)结果是一个充满None值的列,而我期望的是带有一些NaT的datetime64[ns]。我做错了什么?我如何才能完成这项任务?
发布于 2020-04-15 03:43:15
rd_na函数中缺少返回值
def rd_na(a, b):
if pd.isnull(a) or pd.isnull(b):
return pd.NaT
else:
return a + relativedelta(months = b)考虑在处理pd.NaT时使用pandas中的DateOffset
from pandas.tseries.offsets import DateOffset
df['theoretical_eoc'] = turnover.apply(lambda x: x.JD +
DateOffset(months=x.CD), axis=1)https://stackoverflow.com/questions/61215488
复制相似问题