首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python中的PDFminer

Python中的PDFminer
EN

Stack Overflow用户
提问于 2013-07-24 03:18:58
回答 2查看 2.8K关注 0票数 1

我下载了pdfminer,命令行方法工作得很好,但我希望能够同时转换多个pdf文档,所以我尝试使用pdfminer作为库,我发现这个os堆栈溢出,但我不能让它工作..

代码语言:javascript
复制
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from cStringIO import StringIO



def convert_pdf(path):

    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    codec = 'utf-8'
    laparams = LAParams()
    device = TextConverter(rsrcmgr, retstr, codec=codec, laparams=laparams)

    fp = file(path, 'rb')
    process_pdf(rsrcmgr, device, fp)
    fp.close()
    device.close()

    str = retstr.getvalue()
    retstr.close()
    print str


convert_pdf("/Users/gorkemyurtseven/Desktop/casino.pdf")

当我运行它时,我得到:

代码语言:javascript
复制
Traceback (most recent call last):
  File "pdfminer.py", line 1, in <module>
    from pdfminer.pdfinterp import PDFResourceManager, process_pdf
  File "/Users/gorkemyurtseven/Desktop/pdfminer.py", line 1, in <module>
    from pdfminer.pdfinterp import PDFResourceManager, process_pdf
ImportError: No module named pdfinterp
EN

回答 2

Stack Overflow用户

发布于 2013-11-07 17:56:34

您似乎正在调用脚本pdfminer作为模块,并且当尝试导入具有相同名称的模块时,它会变得疯狂。

另一个原因可能是pdfminer模块安装不正确,或者它不是您的python发行版的正确版本。

票数 2
EN

Stack Overflow用户

发布于 2018-10-05 01:15:09

正如在this帖子中所解释的,问题是您的文件名为pdfminer.py

更改名称并删除创建的__pycache__/目录和pdfminer.pyc文件:

代码语言:javascript
复制
$ rm -r __pycache__/ pdfminer.pyc
$ mv pdfminer.py mypdfminer.py
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17819176

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档