首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从文件读取和写入UTF-8

从文件读取和写入UTF-8
EN

Stack Overflow用户
提问于 2017-04-30 23:19:51
回答 1查看 962关注 0票数 0

我有一些用UTF-8编码的文本。“事前事后”它是从网络上获取的。“-”字符是问题所在。如果尝试使用复制和粘贴直接从命令行打印:

代码语言:javascript
复制
>>> text = 'Before – after.'
>>> print text
Before – after.

但是,如果保存为文本文件并尝试打印:

代码语言:javascript
复制
>>> for line in ('file.txt','r'):
>>>     print line
Before û after.

我很确定这是某种UTF-8编码/解码错误,但它让我摸不着头脑。我尝试过解码或重新编码,但也不是这样。

代码语言:javascript
复制
>>> for line in ('file.txt','r'):
>>>     print line.decode('utf-8')
UnicodeDecodeError: 'utf8' codec can't decode byte 0x96 in position 7: invalid start byte

>>> for line in ('file.txt','r'):
>>>     print line.encode('utf-8')
UnicodeDecodeError: 'utf8' codec can't decode byte 0x96 in position 7: invalid start byte
EN

回答 1

Stack Overflow用户

发布于 2017-04-30 23:29:08

这是因为无法对非ascii字符进行编码或解码。您可以将其去掉,然后打印ascii值。看一下这个问题:UnicodeDecodeError: 'utf8' codec can't decode byte 0xa5 in position 0: invalid start byte

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43707974

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档