我有一个.csv文件,我想将非英语文本和英语文本分开放在两个不同的文件中。下面是我尝试过的代码:
import string
def isEnglish(s):
return s.translate(None, string.punctuation).isalnum()
file=open('File1.csv','r',encoding='UTF-8')
outfile1=open('Eng.csv','w', encoding='utf-8')
outfile2=open('Noneng.csv','w', encoding='utf-8')
for line in file.readlines():
r = isEnglish(line)
if r:
outfile1.write(line+"\n")
else:
outfile2.write(line+"\n")代码没有生成所需的结果。两个文件中都有重复的英文文本。我已经附加了一个输出文件的快照。
发布于 2019-11-03 23:53:59
您没有提到代码会产生这样的结果:
TypeError: translate() takes exactly one argument (2 given)请您阅读详细手册:https://docs.python.org/3/library/stdtypes.html#str.translate
文档提供了一个非常重要的提示,即您应该调用str.maketrans( ... )来创建所需的转换映射。这将帮助您识别严格由字母数字组成的输入字符串。
translation_table = str.maketrans('', '', string.punctuation)https://stackoverflow.com/questions/58681582
复制相似问题