首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pandas Groupby: Groupby条件语句

Pandas Groupby: Groupby条件语句
EN

Stack Overflow用户
提问于 2019-03-23 02:39:16
回答 1查看 40关注 0票数 0

我正在尝试从gps数据中确定停靠点的位置,但需要考虑一些gps漂移。

我已经识别了停靠点,并将它们隔离到一个新的数据帧中:

代码语言:javascript
复制
df['Stopped'] = (df.groupby('DAY')['LAT'].diff().abs() <= 0.0005) & (df.groupby('DAY')['LNG'].diff().abs() <= 0.0005)

df2 = df.loc[(df['Stopped'] == True)]

现在,我可以使用以下命令标记在坐标中完全匹配的组:

代码语言:javascript
复制
df2['StoppedEvent'] = df2.groupby(['LAT','LNG']).ngroup()  

但我想按停止的相同条件进行分组。像这样的东西,但它是有效的:

代码语言:javascript
复制
df2['StoppedEvent'] = df2.groupby((['LAT','LNG']).diff().fillna(0).abs() <= 0.0005).ngroup()    
EN

回答 1

Stack Overflow用户

发布于 2019-03-23 02:48:52

我会做一些类似以下的事情:

代码语言:javascript
复制
df['Stopped'] = (df.groupby('DAY')['LAT'].diff().abs() <= 0.0005)\
                & (df.groupby('DAY')['LNG'].diff().abs() <= 0.0005)
df["Stopped_Group"] = (~df["Stopped"]).cumsum()
df2 = df.loc[df['Stopped']]

现在您将拥有一个列"Stopped_Group",它是由您的逻辑确定的一组彼此接近的行中的常量。在原始数据帧df中,此列对于对应于运动的行没有任何意义。

要获得所需的输出(如果我理解正确的话),请执行以下操作:

代码语言:javascript
复制
df2["Stopped_Duration"] = df2.groupby("Stopped_Group").transform("size")
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55305938

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档