文章/答案/技术大牛

发布

社区首页 >问答首页 >获取存在于一个dataframe中的行，而不是另一个

问获取存在于一个dataframe中的行，而不是另一个
EN

Stack Overflow用户

提问于 2014-09-20 07:30:12

回答 1查看 232关注 0票数 0

我想从df1中提取那些在df2中不存在的行(标识是索引)。对于下面的示例，我希望返回df1中的第一行。不幸的是，结果是空的。

import pandas as pd

df1 = pd.DataFrame({
    'level-0': ['a', 'a', 'a', 'a', 'a', 'a'],
    'level-1': ['s2', 's2', 's2', 's2', 's2', 's2'],
    'level-2': ['1', '1', '1', '1', '1', '1'],
    'level-3': ['19', '20', '21', '22', '23', '24'],
    'level-4': ['HRB', 'HRB', 'HRB', 'HRB', 'HRB', 'HRB'],
    'name': ['a', 'b', 'c', 'd', 'e', 'f']
})

df1 = df1.set_index(['level-0', 'level-1', 'level-2', 'level-3', 'level-4'], drop=False)

df2 = pd.DataFrame({
    'level-0': ['a', 'a', 'a', 'a', 'a', 'b'],
    'level-1': ['s2', 's2', 's2', 's2', 's2', 's2'],
    'level-2': ['1', '1', '1', '1', '1', '1'],
    'level-3': ['19', '20', '21', '22', '23', '24'],
    'level-4': ['HRB', 'HRB', 'HRB', 'HRB', 'HRB', 'HRB']
})
df2 = df2.set_index(['level-0', 'level-1', 'level-2', 'level-3', 'level-4'], drop=False)

# all indices that are in df1 but not in df2
df_unknown = df1[~df1.index.isin(df2.index)]
print df_unknown

你的选择有什么问题？

更新

我知道出了什么问题。数据从Excel文件中读取，某些系列被解释为int，而要与之比较的数据格式已经转换为str。这导致了不同的指数。

python

pandas

dataframe

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-09-20 07:53:00

默认情况下，set_index没有到位，因此在调用之后，df1和df2仍然有它们的数字索引。做任何一件

df2.set_index(..., inplace=True)

或

df2 = df2.set_index(...)

你会发现，到目前为止，熊猫的大多数方法都是这样工作的。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/25946391

复制

相似问题

问获取存在于一个dataframe中的行，而不是另一个
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问获取存在于一个dataframe中的行，而不是另一个EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问获取存在于一个dataframe中的行，而不是另一个
EN