首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >tabula-py无法读取pdf文件

tabula-py无法读取pdf文件
EN

Stack Overflow用户
提问于 2020-01-07 02:31:20
回答 1查看 258关注 0票数 2

我的代码:

代码语言:javascript
复制
import tabula
import os

dir_path = os.path.dirname(os.path.realpath(__file__))
file_path = dir_path + '\ALPINE_' + str(20191107) + '.pdf'
print(file_path)
df = tabula.read_pdf('ALPINE_20191107.pdf',multiple_tables=True, pages="all")

结果:

代码语言:javascript
复制
runfile('C:/Users/Admin/Documents/lucas/testTabula.py.py', wdir='C:/Users/Admin/Documents/lucas')
Traceback (most recent call last):

  File "<ipython-input-29-a6b390aef3cf>", line 1, in <module>
    runfile('C:/Users/Admin/Documents/lucas/sem título0.py', wdir='C:/Users/Admin/Documents/lucas')

  File "C:\ProgramData\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py", line 827, in runfile
    execfile(filename, namespace)

  File "C:\ProgramData\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py", line 110, in execfile
    exec(compile(f.read(), filename, 'exec'), namespace)

  File "C:/Users/Admin/Documents/lucas/sem título0.py", line 12, in <module>
    df = tabula.read_pdf('ALPINE_20191107.pdf',multiple_tables=True, pages="all")

  File "C:\ProgramData\Anaconda3\lib\site-packages\tabula\io.py", line 332, in read_pdf
    return _extract_from(raw_json, pandas_options)

  File "C:\ProgramData\Anaconda3\lib\site-packages\tabula\io.py", line 664, in _extract_from
    df[c] = pd.to_numeric(df[c], errors="ignore")

  File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\tools\numeric.py", line 138, in to_numeric
    raise TypeError("arg must be a list, tuple, 1-d array, or Series")

TypeError: arg must be a list, tuple, 1-d array, or Series

它的功能似乎不起作用。我可以直接输入路径以使其更简单,但它也不起作用。这可能是pdf文件的问题,但我已经看到它在另一个环境中使用相同的脚本和相同的文件。

我已经通过文档在两个可能的路径('C:\Program Files\Java\jre1.8.0_231\bin')上设置了java,但这真的无关紧要,无论有没有在PATH上设置,错误都会发生。我也尝试添加jdk,但也没有解决问题。

我注意到提到熊猫的错误,所以可能与我的版本(最新版本)冲突,但我不确定。

python是3.7.4,而java是最新版本

EN

回答 1

Stack Overflow用户

发布于 2020-01-08 06:25:57

我也遇到过同样的问题。我使用的是使用pip安装的版本,即tabula-py 2.0.0。我卸载了这个版本,并使用conda install -c conda-forge tabula-py从Anaconda安装,当前版本是tabula-py 1.4.1,它解决了这个问题。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59617178

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档