首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用多个编码编码文本

用多个编码编码文本
EN

Stack Overflow用户
提问于 2019-05-10 10:02:16
回答 1查看 502关注 0票数 1

我试图在python中打开一个txt文件并使用open()read()读取它,问题是有些文本不是UTF-8。以下是错误:

UnicodeDecodeError:“charmap”编解码器无法解码位置1911885中的字节0x8f :字符映射到

我怎么读这份文件?

EN

回答 1

Stack Overflow用户

发布于 2019-05-10 10:20:36

您可能需要检查这个问题的所有答案,因为它看起来非常类似于您的问题:UnicodeDecodeError: 'charmap' codec can't decode byte X in position Y: character maps to

如网站所述,请尝试:

代码语言:javascript
复制
file = open(filename, encoding="utf8")

我正打算分享这个评论,但我没有足够的声誉:)

编辑:阅读了你的评论,作为对我之前的回答的回应,并按照塞特的建议加以改进:

处理编码错误的最佳方法可能是使用错误参数。正如在你的问题中所说,如果只有一些字符没有被解码,那么这应该是可以使用的。

代码语言:javascript
复制
file = open(filename, encoding="utf8", errors = "ignore")

注意:使用此参数将导致Python忽略该特殊字符。因此,只有当您对丢失一些数据感到满意时,我才会建议您这样做。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56075269

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档