文章/答案/技术大牛

发布

社区首页 >问答首页 >如何使用包含的关键字对pandas中的数据进行分类

问如何使用包含的关键字对pandas中的数据进行分类
EN

Stack Overflow用户

提问于 2019-07-09 11:28:28

回答 2查看 44关注 0票数 2

设df为数据帧，如下所示：

      date   text
0  2019-6-7  London is good.             
1  2019-5-8  I am going to Paris.        
2  2019-4-4  Do you want to go to London?
3  2019-3-7  I love Paris!

我想添加一个列city，它表示text中包含的城市，即

       date  text                          city
0  2019-6-7  London is good.               London
1  2019-5-8  I am going to Paris.          Paris 
2  2019-4-4  Do you want to go to London?  London
3  2019-3-7  I love Paris!                 Paris

如何在不使用lambda的情况下完成此操作

pandas

python

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-07-09 11:31:36

你可以先匹配确定你有城市列表，然后匹配str.findall

df.text.str.findall('London|Paris').str[0]
Out[320]: 
0    London
1     Paris
2    London
3     Paris
Name: text, dtype: object
df['city'] = df.text.str.findall('London|Paris').str[0]

票数 3

Stack Overflow用户

发布于 2019-07-09 11:43:50

加上@WenYoBen的方法，如果一个文本中只有巴黎或伦敦中的一个，那么str.extract更好：

regex = '(London|Paris)'
df['city'] = df.text.str.extract(regex)
df

       date         text                        city
0   2019-6-7    London is good.                 London
1   2019-5-8    I am going to Paris.            Paris
2   2019-4-4    Do you want to go to London?    London
3   2019-3-7    I love Paris!                   Paris

如果你想把你的正则表达式中的所有城市都放在一个文本中，那么str.extractall也是一个选择：

df['city'] = df.text.str.extractall(regex).values
df
          date  text                           city
0    2019-6-7   London is good.                London
1    2019-5-8   I am going to Paris.           Paris
2    2019-4-4   Do you want to go to London?   London
3    2019-3-7   I love Paris!                  Paris

注意，如果有多个匹配项，则extractall将返回一个列表

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56944934

复制

相似问题

问如何使用包含的关键字对pandas中的数据进行分类
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用包含的关键字对pandas中的数据进行分类EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用包含的关键字对pandas中的数据进行分类
EN