首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何比较两个CSV文件并得到区别?

如何比较两个CSV文件并得到区别?
EN

Stack Overflow用户
提问于 2018-02-08 19:42:33
回答 2查看 10.5K关注 0票数 2

我有两个CSV文件,

a1.csv

代码语言:javascript
复制
city,state,link
Aguila,Arizona,https://www.glendaleaz.com/planning/documents/AppendixAZONING.pdf
AkChin,Arizona,http://www.maricopa-az.gov/zoningcode/wp-content/uploads/2014/05/Zoning-Code-Rewrite-Public-Review-Draft-3-Tracked-Edits-lowres1.pdf
Aguila,Arizona,http://www.co.apache.az.us/planning-and-zoning-division/zoning-ordinances/

a2.csv

代码语言:javascript
复制
city,state,link
Aguila,Arizona,http://www.co.apache.az.us

我想知道区别。

以下是我的尝试:

代码语言:javascript
复制
import pandas as pd

a = pd.read_csv('a1.csv')
b = pd.read_csv('a2.csv')

mask = a.isin(b.to_dict(orient='list'))
# Reverse the mask and remove null rows.
# Upside is that index of original rows that
# are now gone are preserved (see result).
c = a[~mask].dropna()
print c

预期输出:

代码语言:javascript
复制
city,state,link
Aguila,Arizona,https://www.glendaleaz.com/planning/documents/AppendixAZONING.pdf
AkChin,Arizona,http://www.maricopa-az.gov/zoningcode/wp-content/uploads/2014/05/Zoning-Code-Rewrite-Public-Review-Draft-3-Tracked-Edits-lowres1.pdf

但是我发现了一个错误:

代码语言:javascript
复制
Empty DataFrame
Columns: [city, state, link]
Index: []**

我想根据前两行进行检查,如果它们是相同的,请将其删除。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-02-08 20:51:23

首先,将DataFrames连接起来,然后删除重复的,同时保留第一个副本。然后重置索引以保持其一致性。

代码语言:javascript
复制
import pandas as pd

a = pd.read_csv('a1.csv')
b = pd.read_csv('a2.csv')
c = pd.concat([a,b], axis=0)

c.drop_duplicates(keep='first', inplace=True) # Set keep to False if you don't want any
                                              # of the duplicates at all
c.reset_index(drop=True, inplace=True)
print(c)
票数 1
EN

Stack Overflow用户

发布于 2018-02-08 19:56:21

您可以使用pandas读取两个文件,加入它们并删除所有重复的行:

代码语言:javascript
复制
import pandas as pd
a = pd.read_csv('a1.csv')
b = pd.read_csv('a2.csv')
ab = pd.concat([a,b], axis=0)
ab.drop_duplicates(keep=False)

参考资料:duplicates.html

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48693547

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档