此link显示如何将pdf%s转换为图像。有没有办法在转换成图片之前缩放我的pdf?在我的项目中,我将pdf%s转换为png%s,然后使用Python-tesseract库提取文本。我注意到,如果我缩放OCR s,然后将部分保存为pngs,那么pdf会提供更好的效果。那么有没有办法在转换成png之前缩放pdf文件呢?
发布于 2019-03-29 01:48:17
我认为提高图像的质量(分辨率)是一个比放大pdf更好的解决方案。
使用pdf2image,你可以很容易地做到这一点:
安装pdf2image:pip install pdf2image
然后,在python中,将您的pdf转换为高质量的图像:
from pdf2image import convert_from_path
pages = convert_from_path('sample.pdf', 400) #400 is the Image quality in DPI (default 200)
pages[0].save("sample.png")通过使用quality参数,你应该会得到你想要的结果
https://stackoverflow.com/questions/55305385
复制相似问题