我试图在python中打开一个txt文件并使用open()和read()读取它,问题是有些文本不是UTF-8。以下是错误:
UnicodeDecodeError:“charmap”编解码器无法解码位置1911885中的字节0x8f :字符映射到
我怎么读这份文件?
发布于 2019-05-10 10:20:36
您可能需要检查这个问题的所有答案,因为它看起来非常类似于您的问题:UnicodeDecodeError: 'charmap' codec can't decode byte X in position Y: character maps to
如网站所述,请尝试:
file = open(filename, encoding="utf8")我正打算分享这个评论,但我没有足够的声誉:)
编辑:阅读了你的评论,作为对我之前的回答的回应,并按照塞特的建议加以改进:
处理编码错误的最佳方法可能是使用错误参数。正如在你的问题中所说,如果只有一些字符没有被解码,那么这应该是可以使用的。
file = open(filename, encoding="utf8", errors = "ignore")注意:使用此参数将导致Python忽略该特殊字符。因此,只有当您对丢失一些数据感到满意时,我才会建议您这样做。
https://stackoverflow.com/questions/56075269
复制相似问题