我有一个数据框架:
County Date Cases
0 Adams 1/20/20 0
1 Adams 1/21/20 550
2 Adams 1/22/20 650
3 Adams 1/23/20 800
4 Adams 1/24/20 900
5 Adams 1/25/20 1000我想创建一个新的列'Cases per day‘,我想用索引1和索引0,索引3和索引2...etc之间的差异来填充它,直到整个列都是字段。我该怎么做呢。理想情况下,我希望新输出如下所示
County Date Cases Cases Per Day
0 Adams 1/20/20 0 0
1 Adams 1/21/20 550 550
2 Adams 1/22/20 650 100
3 Adams 1/23/20 800 150
4 Adams 1/24/20 900 100
5 Adams 1/25/20 1000 100发布于 2020-06-08 23:27:08
您应该避免迭代pandas、DataFrames或Series,而应尝试使用pandas或numpy的矢量化方法。在这里,shift将提供帮助:
df['Cases Per Day'] = df['Cases'] - df['Cases'].shift().fillna(0).astype('int')将在没有(显式)循环的情况下给出预期结果。
https://stackoverflow.com/questions/62265253
复制相似问题