我已经使用PyPDF2创建了一个PDF Splitter。它将大小超过20Mb的PDF拆分为多个较小的PDF。
我使用的逻辑是将所有页面分割成单页PDF,找到每个页面的大小。添加大小,直到达到20Mb并拆分。
我面临的问题是,PDF中的某些页面几乎与原始PDF的大小相同。尽管当我手动进行页面提取时,页面大小约为500Kb。
不确定大小增加的原因。请帮我解决这些问题。
for i in range(pdf_reader.numPages):
# New PDF with each page
outputpdf = newpath + '\\' + pp.split('.pdf')[0] + 'page' + str(i+1) +'.pdf'
#PDF Writer
output = PyPDF2.PdfFileWriter()
#Writing each page to PDF Writer
output.addPage(pdf_reader.getPage(i))
#Write into the new PDF
with open(outputpdf, "wb") as outputStream:
output.write(outputStream)发布于 2020-05-05 20:06:23
经过多次尝试和错误,我终于找到了答案。我使用pdfrw库来提取每个页面,而不是PyPDF2,我不再面临同样的问题。
https://stackoverflow.com/questions/61545425
复制相似问题