首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将PDF转换为HTML?

如何将PDF转换为HTML?
EN

Stack Overflow用户
提问于 2009-10-29 01:52:55
回答 9查看 21.8K关注 0票数 30

在任何通用语言中,有什么好的库可以将PDF转换为HTML?

EN

回答 9

Stack Overflow用户

发布于 2009-11-24 01:47:53

apache的PDFBox具有html提取功能。http://pdfbox.apache.org/

票数 5
EN

Stack Overflow用户

发布于 2009-10-30 03:01:16

如果你在Windows box上工作,我想Amyuni也有一个这样的库。他们的PDF文档转换器可以作为DLL访问,可以在Visual Studio支持的语言中广泛使用,并可以转换为RTF、TML、EXCEL、JPEG和TIFF。

票数 3
EN

Stack Overflow用户

发布于 2010-10-04 15:56:44

pdftohtml程序将pdf转换为html和xml,并保留文本的位置信息,这有助于抓取表格。

它似乎基于xpdf库,并且也有一个windows二进制文件。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1638937

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档