我正在尝试比较两个.csv文件。第一个有一堆特意分成不同列的属性。第二个csv将所有这些属性组合到一个单元格中。我希望找到一定数量的匹配项,并在确认后,从第二个csv中的另一个单元格(图像ID)获取数据。
我正在使用pandas (新手),到目前为止,我认为extract/extract是我想要的地方。但是在这个基本的测试中,我看不出为什么我没有得到任何匹配。
image_index = pd.Series(['Classic', 'Duffle', 'Bag', 'Leather'])
image_index.str.extract('(?P<duffle>(?i)Duffle)(?P<bag>(?i)Bag)', expand=False)结果:
duffle bag
0 NaN NaN
1 NaN NaN
2 NaN NaN
3 NaN NaN发布于 2017-02-22 23:28:07
您需要组之间的交替|,因为每个组模式只包含在一个字符串中:
>>> image_index.str.extract('(?P<duffle>(?i)Duffle)|(?P<bag>(?i)Bag)', expand=False)
duffle bag
0 NaN NaN
1 Duffle NaN
2 NaN Bag
3 NaN NaNhttps://stackoverflow.com/questions/42395629
复制相似问题