我有150个.doc (Microsoft Word)文件,每个文件由6页组成。我想把每个单独的文件保存成3个文件,第一个是页面1-2,第二个是3-4,第三个是5-6。最好的方法是循环执行这个操作,这样我就可以用一个脚本处理所有150个文件。输出是.doc还是PDF都没有关系。有没有办法做到这一点?有一次手动做了类似的拆分操作,花了很多小时,所以我想走捷径。
非常感谢你,M。
发布于 2017-05-23 05:46:04
也许您可以使用python读取每个文档,并将其保存为临时文件或流,然后重写文档文件。
示例:
one_doc = open('1.docx', 'rb')
two_doc = open('2.docx', 'rb')
three_doc = open('3.docx', 'rb')
lines_one = one_doc.readlines()
lines_two = two_doc.readlines()
lines_three = three_doc.readlines()
file = open("C:\myfile.doc","w")
file.writelines(lines_one)
file.writelines(lines_two)
file.writelines(lines_three)
file.close()http://python-docx.readthedocs.io/en/latest/user/documents.html
为了记录起见,如果需要切入某个特定的页面,您可能可以计算行数并将其划分。
https://stackoverflow.com/questions/44122499
复制相似问题