首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >读取PDF时忽略特殊字符

读取PDF时忽略特殊字符
EN

Stack Overflow用户
提问于 2020-09-03 14:20:14
回答 1查看 383关注 0票数 0

我正在使用pdfplumber刮PDF文本。然后,我使用write (来自包string)将其写入文本文件。在pdfs开始添加特殊字符(如↓)之前,它运行得很好。现在,当我将它写到文本文件时,我会得到一个unicode错误。是否存在忽略这个特殊字符并写出其余文本的问题?

代码:

代码语言:javascript
复制
dataFile = open('AgW1.txt','w')
for eachitem in aList:
    dataFile.write(str(eachitem)+'\n')

溯源

代码语言:javascript
复制
UnicodeEncodeError                        Traceback (most recent call last)
<ipython-input-12-13532302c2d5> in <module>
      1 for eachitem in aList:
----> 2     dataFile.write(str(eachitem)+'\n')

~\Anaconda3\lib\encodings\cp1252.py in encode(self, input, final)
     17 class IncrementalEncoder(codecs.IncrementalEncoder):
     18     def encode(self, input, final=False):
---> 19         return codecs.charmap_encode(input,self.errors,encoding_table)[0]
     20 
     21 class IncrementalDecoder(codecs.IncrementalDecoder):

UnicodeEncodeError: 'charmap' codec can't encode character '\u2193' in position 63: character maps to <undefined>
EN

回答 1

Stack Overflow用户

发布于 2020-09-03 17:14:55

尝试将utf-8编码添加到打开的文件中,即dataFile = open('AgW1.txt','w', encoding='utf-8')

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63725596

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档