首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >UnicodeDecodeError:'utf-8‘编解码器无法解码位置为886的字节0xa3 :无效的起始字节:jsonline

UnicodeDecodeError:'utf-8‘编解码器无法解码位置为886的字节0xa3 :无效的起始字节:jsonline
EN

Stack Overflow用户
提问于 2021-03-11 05:50:20
回答 1查看 676关注 0票数 0

我正在尝试从jsonl文件中读取行,但我得到了以下错误。

文件“"C:\Users\Administrator\Anaconda3\lib\site-packages\jsonlines\jsonlines.py",”(最近一次调用):文件"insertion_script.py",第12行,在f.iter()中的第12行:文件f.iter()中的第204行,在iter skip_empty=skip_empty中的文件

第143行,在read lineno中,在line = next(self._line_iter) "C:\Users\Administrator\Anaconda3\lib\codecs.py",中第322行,在解码(结果,消费)=self._buffer_decode(数据,self.errors,最终) UnicodeDecodeError:'utf-8‘编解码器无法解码字节0xa3的位置886:无效的开始字节

代码语言:javascript
复制
BH_data = []
with jsonlines.open('2401659.jsonl','r') as f:
    for line in f.iter():
        BH_data.append(line)
EN

回答 1

Stack Overflow用户

发布于 2021-03-11 06:05:09

这意味着您的数据实际上不在UTF-8中。0xA3恰好是Windows代码页面中英镑的英镑符号。你应该试试

代码语言:javascript
复制
import codecs
with codecs.open('2401659.jsonl','r',encoding='cp1252') as jfile:
    with jsonlines.Reader(jfile) as f:
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66577130

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档