我正试图将pdf转换成图像,使用pdf2image模块上的Google。我已经下载了最新版本的波普普勒,也安装了poppler。在convert_from_path()中,我提到了到达poppler目录的正确路径,但我仍然得到了FileNotFoundError和PDFInfoNotInstalled错误。
请参阅附件中的截图以获得更多的清晰度。错误截图
发布于 2022-09-23 07:22:40
AFAIK,Google正在运行一个Ubuntu操作系统,您可以通过运行uname -a命令来发现这一点。
如果是你建造波普尔,则pdf*二进制文件安装在/usr/bin中,pdf2image可以自动解析它们。
发现操作系统名称。
!uname -a;Linux d9b9a62155f2 5.10.133+ #1 SMP Fri Aug 26 08:44:51 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux!cat requirements.txtpdf2image安装python依赖项
!pip install -r requirements.txt安装一些依赖关系来构建poppler
!apt update
!apt-get install libnss3 libnss3-dev
!apt-get install libcairo2-dev libjpeg-dev libgif-dev
!apt-get install cmake libblkid-dev e2fslibs-dev libboost-all-dev libaudit-dev下载并解压弹出程序源代码。
!wget https://poppler.freedesktop.org/poppler-21.09.0.tar.xz;
!tar -xvf poppler-21.09.0.tar.xz;编译并安装poppler。
!mkdir -p poppler-21.09.0/build && \
cd poppler-21.09.0 && \
cmake -DCMAKE_BUILD_TYPE=Release \
-DCMAKE_INSTALL_PREFIX=/usr \
-DTESTDATADIR=$PWD/testfiles \
-DENABLE_UNSTABLE_API_ABI_HEADERS=ON && \
make && \
make install使用PDF文件
from pdf2image import convert_from_path, convert_from_bytes
images = convert_from_path('sample.pdf', poppler_path='/usr/bin/')https://stackoverflow.com/questions/73823700
复制相似问题