文章/答案/技术大牛

发布

社区首页 >问答首页 >如何删除或过滤列表中的非英语字符串(中文、韩文、日文、阿拉伯文)？

问如何删除或过滤列表中的非英语字符串(中文、韩文、日文、阿拉伯文)？
EN

Stack Overflow用户

提问于 2020-05-11 02:38:54

回答 4查看 1.1K关注 0票数 1

下面是一个输入示例：

['ARTA Travel Group', 'Arta | آرتا', 'ARTAS™ Practice Development',    'ArtBinder', 'Arte Arac Takip App', 'アート建築', 'Arte Brasil Bar &    Grill', 'ArtPod Stage', 'Artpollo扫码', 'Artpollo阿波罗-价值最优的艺术品投资电商',    '아트홀']

和上面的列表一样，我想删除中文、韩文、日文、阿里巴语的元素。

以下是预期产出(只有英文本)：

['ARTA Travel Group', 'ARTAS™ Practice Development', 'ArtBinder', 'Arte Arac Takip App', 'Arte Brasil Bar & Grill', 'ArtPod Stage']

python

string

non-english

回答 4

Stack Overflow用户

回答已采纳

发布于 2020-05-11 03:03:33

您可以使用regex并使用unicode范围进行搜索。字母符号属于2100—214F，范围从2100—214F；您可以将它们全部包括在内，也可以只选择特定的。

import re

s = ['ARTA Travel Group', 'Arta | آرتا', 'ARTAS™ Practice Development', 'ArtBinder', 'Arte Arac Takip App', 'アート建築', 'Arte Brasil Bar & Grill', 'ArtPod Stage', 'Artpollo扫码', 'Artpollo阿波罗-价值最优的艺术品投资电商', '아트홀']

result = [i for i in s if not re.findall("[^\u0000-\u05C0\u2100-\u214F]+",i)]

print (result)

['ARTA Travel Group', 'ARTAS™ Practice Development', 'ArtBinder', 'Arte Arac Takip App', 'Arte Brasil Bar & Grill', 'ArtPod Stage']

票数 2

Stack Overflow用户

发布于 2020-05-11 02:42:09

对不起，由于名誉锁，我不能对这篇文章发表评论，但是这里。

这个问题在这里得到回答，在Python中检测带有非英语字符的字符串

希望这能有所帮助！

票数 3

Stack Overflow用户

发布于 2022-03-23 05:23:14

您可以使用python3.7中引入的函数isascii删除列表中的非英语字符串。因此，使用此函数的最低要求是您必须拥有python >= python3.7。

 def isEnglish(s):

  return s.isascii()

print(isEnglish("Test"))

print(isEnglish("['ARTA Travel Group', 'Arta | آرتا', 'ARTAS™ Practice Development',    'ArtBinder', 'Arte Arac Takip App', 'アート建築', 'Arte Brasil Bar &    Grill', 'ArtPod Stage', 'Artpollo扫码', 'Artpollo阿波罗-价值最优的艺术品投资电商',    '아트홀']"))

输出：

  ['ARTA Travel Group', 'ARTAS™ Practice Development', 'ArtBinder', 'Arte Arac Takip App', 'Arte Brasil Bar & Grill', 'ArtPod Stage']

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/61721443

复制

相似问题

问如何删除或过滤列表中的非英语字符串(中文、韩文、日文、阿拉伯文)？
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何删除或过滤列表中的非英语字符串(中文、韩文、日文、阿拉伯文)？EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何删除或过滤列表中的非英语字符串(中文、韩文、日文、阿拉伯文)？
EN