这里是业余Python开发人员。我正在进行一个项目,在这个项目中,我使用了多个PDfs,每个页面都有不同数量的页面(1-20),并将它们转换为PNG文件,以便稍后与pytesseract一起使用。
我使用的pdf2image和波普勒的测试pdf,有3页。问题是它只将PDF的最后一页转换为PNG。我想“也许程序是为每个pdf页面创建相同的文件名,每次迭代它都会重写文件直到最后一个pdf页还剩下”所以我试着编写这个程序,这样它就可以在每次迭代中更改文件名。这是密码。
from pdf2image import convert_from_path
images = convert_from_path('/Users/jacobpatty/vscode_projects/badger_colors/test_ai/10254_Craigs_Plumbing.pdf', 200)
file_name = 'ping_from_ai_test.png'
file_number = 0
for image in images:
file_number =+ 1
file_name = 'ping_from_ai_test' + str(file_number) + '.png'
image.save(file_name)这在两个方面都失败了。它只制作了2个png文件(‘ping_from_ai_test.png’和'ping_from_ai_test1.png')而不是3个,当我单击png文件时,它们都只是最后一个pdf页面。我现在不知道该怎么办,有什么想法吗?
发布于 2022-04-15 17:40:36
据我所知,您的代码只输出一个文件。问题是您的代码中有一个错误。
线
file_number =+ 1
实际上是一项任务:
file_number = (+1)
这可能应该是
file_number += 1
发布于 2022-04-15 17:47:44
尝试这样做,而不是对图像中的图像:
for n in range(len(images)):
images[n].save('test' + str(n) + '.png')那有用吗?
https://stackoverflow.com/questions/71886955
复制相似问题