首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何避免在pandas数据帧上插入重复的行?

如何避免在pandas数据帧上插入重复的行?
EN

Stack Overflow用户
提问于 2016-08-03 11:18:53
回答 1查看 954关注 0票数 0

我正在处理熊猫数据帧和mysql,我的表格是与时间序列相关的,比如,

代码语言:javascript
复制
symbol_id  date     close
1          2016-6-1 123
1          2016-6-2 133
1          2016-6-3 143
2          2016-6-1 23
2          2016-6-2 33
2          2016-6-3 43

在将新数据帧断言到表中时,我使用

代码语言:javascript
复制
df.to_sql(name='symbol_test1', con=engine, if_exists = 'replace', index=True)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-08-03 13:41:56

假设您想要删除重复项,您可以这样做

代码语言:javascript
复制
df.drop_duplicates(subset='symbol_id') 

如果未指定任何子集参数,则默认情况下,它会检查行级重复项。

有保留第一次出现或最后一次出现等选项。请参阅:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38733807

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档