我正在尝试从jsonl文件中读取行,但我得到了以下错误。
文件“"C:\Users\Administrator\Anaconda3\lib\site-packages\jsonlines\jsonlines.py",”(最近一次调用):文件"insertion_script.py",第12行,在f.iter()中的第12行:文件f.iter()中的第204行,在iter skip_empty=skip_empty中的文件
第143行,在read lineno中,在line = next(self._line_iter) "C:\Users\Administrator\Anaconda3\lib\codecs.py",中第322行,在解码(结果,消费)=self._buffer_decode(数据,self.errors,最终) UnicodeDecodeError:'utf-8‘编解码器无法解码字节0xa3的位置886:无效的开始字节
BH_data = []
with jsonlines.open('2401659.jsonl','r') as f:
for line in f.iter():
BH_data.append(line)发布于 2021-03-11 06:05:09
这意味着您的数据实际上不在UTF-8中。0xA3恰好是Windows代码页面中英镑的英镑符号。你应该试试
import codecs
with codecs.open('2401659.jsonl','r',encoding='cp1252') as jfile:
with jsonlines.Reader(jfile) as f:https://stackoverflow.com/questions/66577130
复制相似问题