我正在编写一个python脚本,将多个PDF合并为一个,放入输出文件夹中。每个PDF将在一个不同的文件夹中与其上的员工姓名,它将需要与另一个文件夹中相应的pdf组合。并非所有员工都会拥有每个文件,因此我将其包含在逻辑中。
我目前遇到的问题是,PdfFileMerger在追加文件时需要一个字符串,而pathlib库返回一个windowpath对象。这将不容易转换为字符串。我从pypdf Merging multiple pdf files into one pdf这篇文章中获得了关于PyPDF2的信息。我是pathlib库的新手,我是否应该进行转换,或者是否应该获得不同的path对象?
from PyPDF2 import PdfFileMerger, PdfFileReader
from pathlib import Path
tc = Path('totalcomp')
merger = PdfFileMerger()
for i in tc.iterdir():
pdfs = []
try:
pdfs.append(Path(f'profitshare/{i.name}'))
pdfs.append(Path(f'merit/{i.name}'))
finally:
pdfs.append(i)
for pdf in pdfs:
output = i.name
merger.append(pdf, 'rb')
merger.write(Path(f'/output/{i.name}'))发布于 2020-05-07 00:08:18
路径的字符串表示是原始文件系统路径本身(以本机形式,例如在Windows下使用反斜杠),您可以将其传递给任何将文件路径作为字符串的函数:
>>> p = PurePath('/etc')
>>> str(p)
'/etc'
>>> p = PureWindowsPath('c:/Program Files')
>>> str(p)
'c:\\Program Files'因此,解决方案是用str()函数包装Path()对象:
from PyPDF2 import PdfFileMerger, PdfFileReader
from pathlib import Path
tc = Path('totalcomp')
merger = PdfFileMerger()
for i in tc.iterdir():
pdfs = []
try:
pdfs.append(str(Path(f'profitshare/{i.name}')))
pdfs.append(str(Path(f'merit/{i.name}')))
finally:
pdfs.append(i)
for pdf in pdfs:
output = i.name
merger.append(pdf, 'rb')
merger.write(str(Path(f'/output/{i.name}')))顺便说一句,还有另一个pathlib的方法,它以字符串形式返回路径:as_posix()
返回带有正斜杠(/)的路径的字符串表示形式:
>>>
>>> p = PureWindowsPath('c:\\windows')
>>> str(p)
'c:\\windows'
>>> p.as_posix()
'c:/windows'https://stackoverflow.com/questions/51847408
复制相似问题