首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何选择数据框中每组最旧的记录?使用python

如何选择数据框中每组最旧的记录?使用python
EN

Stack Overflow用户
提问于 2021-05-04 10:23:24
回答 1查看 59关注 0票数 1

举个例子,一个数据帧看起来像这样:

代码语言:javascript
复制
         date  price ticker  volume
0   2018-01-01  1.323     AI    2000
1   2018-01-02  1.525     AI    1500
2   2018-01-03  1.045     AI     500
3   2018-01-04  1.845     AI     600
4   2018-01-05  1.045     AI     500
5   2018-01-02  1.446    BOC     550
6   2018-01-03  2.110    BOC    3201
7   2018-01-04  2.150    BOC    5200
8   2018-01-05  2.810    BOC    1980
9   2018-01-03  5.199    CAT    2000
10  2018-01-06  4.980    CAT     450
11  2018-01-07  4.990    CAT    3000

我将问一个非常基本的问题,请耐心等待,如何选择具有最早日期的前两个报价器,以获得如下数据帧

代码语言:javascript
复制
         date  price ticker  volume
0   2018-01-01  1.323     AI    2000
1   2018-01-02  1.525     AI    1500
5   2018-01-01  1.446    BOC     550
6   2018-01-02  2.110    BOC    3201
9   2018-01-01  5.199    CAT    2000
10  2018-01-02  4.980    CAT     450
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-05-04 10:43:25

在Pandas上,您可以使用groupby命令对值进行分组。此外,通过使用带有groupby命令的head命令,您可以选择组中的前两个值。因此,在您的示例中,要对前两个节拍进行分组,命令将为:

代码语言:javascript
复制
df.sort_values('date').groupby('ticker').head(2)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67377998

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档