如果我有一个包含不同语言的字符串的列表,我如何才能删除非英语,而不使用符号和符号的英语字符串。
foreign_strings = ['Instagram', '爱奇艺PPS -《欢乐颂2》电视剧热播', 'Docs To Go™ Free Office Suite', 'Instachat ']所需结果:
english_strings = ['Instagram', 'Docs To Go™ Free Office Suite', 'Instachat ']我试过了
english_strings = []
for i in foreign_strings:
if i.isascii():
english_strings.append(i)
print(english_strings)这将返回:
english_strings = ['Instagram']我怎么能忽略像TM这样的表情符号和符号?
非常感谢
发布于 2022-08-15 10:31:29
这段代码适用于输入:
import re
english_check = re.compile(r'[A-Za-z0-9]')
def isEnglish(s):
list_final = []
for i in s :
if english_check.match(i):
list_final.append(i)
return(list_final)
foreign_strings = ['Instagram', '爱奇艺PPS -《欢乐颂2》电视剧热播', 'Docs To Go™ Free Office Suite', 'Instachat ']
print(isEnglish(foreign_strings))https://stackoverflow.com/questions/73359361
复制相似问题