pdftotext库是requirements.txt中的一个需求。当我试图推到heroku时,我得到了以下错误:remote:Running setup.py install for pdftotext: finished with status 'error'
remote: Complete output/app/.heroku/py
使用perl利用pdftotext从pdf中提取文本。效果很好。我的问题是,我正在阅读的pdf是多页的,我在每一页的顶部寻找特定行的数据。下面的代码将两个页面的全部内容转储到一个文件中。我如何首先使用pdftotext或其他实用程序/模块遍历每个页面,然后在每个页面上分别调用pdftotext?div.line div {width:80px;float:left;}open FILE,
result = extract_data('sample.pdf')OSError: pdftotext not installed.Can be downloaded from https://poppler.freedesktop.org/
当我尝试通过pip安装pdftotext时,它显示需要虚拟c++ 14.0。现在,当我尝试pip install pdftotext时,它显示Requirement already satisfied:
我正在尝试安装pdftotext,但是即使在安装了可视化工具之后,我仍然会收到相同的错误。C:\Users\garec\Downloads>pip3 install pdftotext-2.1.4.tar.gzUsing legacy setup.py install for pdftotext, since pac