我正在尝试将我的pdf文件转换为jpg。我首先使用pdf2image将文件保存为.ppm。然后,我想使用PIL将.ppm转换为.jpg。
如何找到pdf2image保存的文件的名称?
这是我的代码:
def to_jpg(just_ids):
for just_id in just_ids:
image = convert_from_path('/Users/davidtannenbaum/Desktop/scraped/{}.pdf'.format(just_id), output_folder='/Users/davidtannenbaum/Desktop/scraped/')
file_name = ?
im = Image.open("/Users/davidtannenbaum/Desktop/scraped/{}.ppm".format(file_name))
im.save("/Users/davidtannenbaum/Desktop/scraped/{}.jpg".format(just_id))发布于 2019-01-20 20:37:26
不需要这样做,image变量应该包含一个Image对象列表。你可以简单地做:
for i, im in enumerate(image):
im.save("/Users/davidtannenbaum/Desktop/scraped/{}_{}.jpg".format(just_id, i)))发布于 2020-05-26 20:16:01
convert_to_path()方法还有一些可以使用的参数。您可以将paths_only参数设置为True,将format属性fmt设置为"jpeg"。
这将直接将图像以JPG格式保存到输出文件夹,而不是PPM,image变量将包含每个图像的相对路径,而不是图像对象。
for just_id in just_ids:
image = convert_from_path('/Users/davidtannenbaum/Desktop/scraped/{}.pdf'.format(just_id), output_folder='/Users/davidtannenbaum/Desktop/scraped/', fmt="jpeg", paths_only=True)发布于 2022-01-07 08:02:50
pdf_path = '/path/to/pdf_images/'
output_folder = '/path/for/output/images/'
for pdf in os.listdir(pdf_path):
filename = pdf.split('.')[0] # prepare your filename
pdfs = convert_from_path(os.path.join(pdf_path,pdf),output_folder=output_folder, output_file=os.path.join(output_folder+ filename), fmt="jpeg")https://stackoverflow.com/questions/53991547
复制相似问题