首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在pandas中映射不同dataframe basis datetime的列

如何在pandas中映射不同dataframe basis datetime的列
EN

Stack Overflow用户
提问于 2019-05-20 16:26:40
回答 1查看 493关注 0票数 1

我有两个熊猫数据帧

代码语言:javascript
复制
df1
code     start_date             tank     product
123      2019-02-23 06:30:00    1        MS
123      2019-02-23 11:35:00    2        HS
123      2019-02-24 06:45:00    1        MS
123      2019-05-12 05:39:00    1        HS

df2
code    tank_ms    product_ms  update   from_date              to_date
123     1          HS          Dealer   2019-01-01 00:00:00    2019-03-31 06:00:00
123     1          MS          Dealer   2019-03-31 06:00:01    2019-05-30 06:00:00
123     2          HS          Dealer   2019-01-01 06:00:01    2019-05-30 06:00:00

现在,我想将df1与df2结合起来用于product_ms,并使用datetime比较进行更新。我想要的数据帧如下

代码语言:javascript
复制
df1
code     start_date             tank     product   product_ms   update  
123      2019-02-23 06:30:00    1        MS        HS           Dealer
123      2019-02-23 11:35:00    2        HS        HS           Dealer
123      2019-02-24 06:45:00    1        MS        HS           Dealer
123      2019-05-12 05:39:00    1        HS        MS           Dealer

来自df1start_date将与来自df2from_dateto_date进行比较

目前我尝试做了以下几件事,

代码语言:javascript
复制
 for x in range(df2.shape[0]):
     from_date = df2['from_date'][x]
     to_date = df2['to_date'][x]
     product_v = tank_data['product_ms'][x]
     tank_status_v = tank_data['update'][x]

     df1['prodcode_ms'] = [product_v if from_date <= t_time < to_date else s for t_time,s in 
          zip(df1['start_date'],df2['product_ms'])]
     df1['update'] = [tank_status_v if 
         from_date <= t_time < to_date else s for t_time,s in zip(df1['start_date'],df2['update'])]
EN

回答 1

Stack Overflow用户

发布于 2019-05-20 17:11:47

DataFrame.merge与outer join一起使用,按boolean indexing和lasr过滤删除不必要的列:

代码语言:javascript
复制
df1['start_date']= pd.to_datetime(df1['start_date'])
df2['from_date']= pd.to_datetime(df2['from_date']
df2['to_date']= pd.to_datetime(df2['to_date']

df = df1.merge(df2.rename(columns={'tank_ms':'tank'}), on=['code','tank'], how='outer')
df = df[(df.start_date > df.from_date) & (df.start_date < df.to_date)]
df = df.drop(['from_date','to_date'], axis=1)
print (df)
   code          start_date  tank product product_ms  update
0   123 2019-02-23 06:30:00     1      MS         HS  Dealer
2   123 2019-02-24 06:45:00     1      MS         HS  Dealer
5   123 2019-05-12 05:39:00     1      HS         MS  Dealer
6   123 2019-02-23 11:35:00     2      HS         HS  Dealer
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56216952

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档