文章/答案/技术大牛

发布

社区首页 >问答首页 >Tabula-py找不到pdf文件

问Tabula-py找不到pdf文件
EN

Stack Overflow用户

提问于 2018-08-02 11:15:47

回答 1查看 847关注 0票数 2

我想用pdfminer和小菜解析一个PDF文件

我阅读了问题并使用了以下代码：

从pdfminer.pdfparser导入PDFParser从pdfminer.pdfdocument导入PDFDocument

import magic
from pyPdf import PdfFileWriter, PdfFileReader
import tabula
import numpy as np
filename = '/home/parser/test.pdf'
magic.from_file(filename,mime=True)

ifpdf = PdfFileReader(file(filename, "rb"))

pdf_info = ifpdf.getDocumentInfo()

nm = [ 'Info_1', 'Info_2','Info_3','Info_4']
df = tabula.read_pdf(filename,pages="all",lattice="all",pandas_options={'header': None,'names':nm,'encoding':'utf-8'})

df.refenseigne.replace(to_replace=r"(M|C)\r",value="",regex=True,inplace=True)
df.to_csv("test.csv",encoding="utf-8")

当我执行我的代码时，我会得到这个错误。

Traceback (most recent call last):
  File "parse_pdf.py", line 16, in <module>
    df = tabula.read_pdf(filename,pages="all",lattice="all",pandas_options={'header': None,'names':nm,'encoding':'utf-8'})
  File "/usr/local/lib/python2.7/dist-packages/tabula/wrapper.py", line 87, in read_pdf
    output = subprocess.check_output(args)
  File "/usr/lib/python2.7/subprocess.py", line 567, in check_output
    process = Popen(stdout=PIPE, *popenargs, **kwargs)
  File "/usr/lib/python2.7/subprocess.py", line 711, in __init__
    errread, errwrite)
  File "/usr/lib/python2.7/subprocess.py", line 1343, in _execute_child
    raise child_exception
OSError: [Errno 2] No such file or directory

奇怪的是，在第9行和第11行，我可以找到文件，但是在第16行，我有这个错误。

我是错了还是小菜问题？

python

python-2.7

pdf

pdfminer

tabula

回答 1

Stack Overflow用户

发布于 2019-05-10 07:11:47

我在Ubuntu也面临着同样的问题。

首先，通过运行java -版本和javac -版本，检查安装在计算机上的JDK和JRE的版本。每个版本都应该大于7。

然后使用pip3安装tabula。

它开始读取，但显示了以下错误

WARNING: Using fallback font 'LiberationSerif' for 'TimesNewRomanPSMT'
May 10, 2019 12:36:29 PM org.apache.pdfbox.pdmodel.font.PDTrueTypeFont

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51652269

复制

相似问题

问Tabula-py找不到pdf文件
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tabula-py找不到pdf文件EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tabula-py找不到pdf文件
EN