首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在python中将pdf转换为docx格式

在python中将pdf转换为docx格式
EN

Stack Overflow用户
提问于 2019-09-04 04:58:58
回答 2查看 412关注 0票数 1

请告诉我如何将pdf转换为docx。我尝试使用pdfminer转换为html来提取文本,但仍然看起来不够好。

EN

回答 2

Stack Overflow用户

发布于 2021-01-28 14:37:35

pdf2docx

单击here,安装

  1. 安装pdf2docx软件包

Installation

  • 克隆或下载pdf2docx

pip安装pdf2docx或#下载软件包并安装您的环境python setup.py install

  • 选项1

从pdf2docx导入转换器pdf_file = r'C:\Users\ABCD\Desktop\XYZ/Document1.pdf'#源文件docx_file = r'C:\Users\ABCD\Desktop\XYZ/sample.docx‘#目标文件# convert pdf to docx cv = Converter(pdf_file) cv.convert(docx_file,start=0,end=None) cv.close() #Output Parsing Page53: 53/53...正在创建第53页: 53/53...在6.258919400000195s.中终止

  • 选项2

从pdf2docx导入解析pdf_file = r'C:\Users\ABCD\Desktop\XYZ/Document2.pdf‘# source file docx_file = r'C:\Users\ABCD\Desktop\XYZ/sample_2.docx’# destination file # convert pdf to docx parse(pdf_file,docx_file,start=0,end=None) # output Parsing Page53: 53/53...正在创建第53页: 53/53...在5.883666100000482s.中终止

票数 3
EN

Stack Overflow用户

发布于 2019-09-25 05:57:56

您可以使用像这样的在线工具:https://pdf2docx.com

如果您使用的是linux,请使用libreoffice api:

代码语言:javascript
复制
libreoffice --headless --convert-to=pdf example.docx
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57778665

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档