首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pandas中DataFrame中的数据操作?

Pandas中DataFrame中的数据操作?
EN

Stack Overflow用户
提问于 2020-12-16 14:40:02
回答 1查看 37关注 0票数 0

我有如下的DataFrame:

代码语言:javascript
复制
rng = pd.date_range('2020-12-01', periods=5, freq='D')
df = pd.DataFrame({"ID" : ["1", "2", "1", "2", "2"],
                   "category" : ["A", "B", "A", "C", "B"],
                   "status" : ["active", "finished", "active", "finished", "other"],
                   "Date": rng})

我需要创建DataFrame并计算2列:

  1. New1 =最后一项协议的类别与“活动”状态
  2. New2=“已完成”状态

的最后协议类别

为了获得更高的精度,下面我给出了结果DataFrame:

EN

回答 1

Stack Overflow用户

发布于 2020-12-16 15:04:15

假设数据已按日期排序,我们希望保留最后一行"status"=="active"和最后一行"status"=="finished"。我们还希望只保留第一列和第二列,并将类别重命名为"New1“表示活动状态,将"New2”重命名为已完成状态。

代码语言:javascript
复制
last_active = df[df.status == "active"].iloc[-1, [0, 1]].rename({"category": "New1"})
last_finished = df[df.status == "finished"].iloc[-1, [0, 1]].rename({"category": "New2"})

我们有两个熊猫系列,我们想并排连接,然后转到每一行有一个条目:

代码语言:javascript
复制
pd.concat([last_active, last_finished], axis=1, sort=False).T

也许,您还想在之后调用"reset_index()“,以便在生成的DataFrame中有一个新的RangeIndex。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65325411

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档