首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何删除或过滤列表中的非英语字符串(中文、韩文、日文、阿拉伯文)?

如何删除或过滤列表中的非英语字符串(中文、韩文、日文、阿拉伯文)?
EN

Stack Overflow用户
提问于 2020-05-11 02:38:54
回答 4查看 1.1K关注 0票数 1

下面是一个输入示例:

代码语言:javascript
复制
['ARTA Travel Group', 'Arta | آرتا', 'ARTAS™ Practice Development',    'ArtBinder', 'Arte Arac Takip App', 'アート建築', 'Arte Brasil Bar &    Grill', 'ArtPod Stage', 'Artpollo扫码', 'Artpollo阿波罗-价值最优的艺术品投资电商',    '아트홀']

和上面的列表一样,我想删除中文、韩文、日文、阿里巴语的元素。

以下是预期产出(只有英文本):

代码语言:javascript
复制
['ARTA Travel Group', 'ARTAS™ Practice Development', 'ArtBinder', 'Arte Arac Takip App', 'Arte Brasil Bar & Grill', 'ArtPod Stage']
EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2020-05-11 03:03:33

您可以使用regex并使用unicode范围进行搜索。字母符号属于2100—214F,范围从2100—214F;您可以将它们全部包括在内,也可以只选择特定的。

代码语言:javascript
复制
import re

s = ['ARTA Travel Group', 'Arta | آرتا', 'ARTAS™ Practice Development', 'ArtBinder', 'Arte Arac Takip App', 'アート建築', 'Arte Brasil Bar & Grill', 'ArtPod Stage', 'Artpollo扫码', 'Artpollo阿波罗-价值最优的艺术品投资电商', '아트홀']

result = [i for i in s if not re.findall("[^\u0000-\u05C0\u2100-\u214F]+",i)]

print (result)

['ARTA Travel Group', 'ARTAS™ Practice Development', 'ArtBinder', 'Arte Arac Takip App', 'Arte Brasil Bar & Grill', 'ArtPod Stage']
票数 2
EN

Stack Overflow用户

发布于 2020-05-11 02:42:09

对不起,由于名誉锁,我不能对这篇文章发表评论,但是这里。

这个问题在这里得到回答,在Python中检测带有非英语字符的字符串

希望这能有所帮助!

票数 3
EN

Stack Overflow用户

发布于 2022-03-23 05:23:14

您可以使用python3.7中引入的函数isascii删除列表中的非英语字符串。因此,使用此函数的最低要求是您必须拥有python >= python3.7。

代码语言:javascript
复制
 def isEnglish(s):

  return s.isascii()

print(isEnglish("Test"))

print(isEnglish("['ARTA Travel Group', 'Arta | آرتا', 'ARTAS™ Practice Development',    'ArtBinder', 'Arte Arac Takip App', 'アート建築', 'Arte Brasil Bar &    Grill', 'ArtPod Stage', 'Artpollo扫码', 'Artpollo阿波罗-价值最优的艺术品投资电商',    '아트홀']"))

输出:

代码语言:javascript
复制
  ['ARTA Travel Group', 'ARTAS™ Practice Development', 'ArtBinder', 'Arte Arac Takip App', 'Arte Brasil Bar & Grill', 'ArtPod Stage']
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61721443

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档