首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从PDF转换为HTML

从PDF转换为HTML
EN

Stack Overflow用户
提问于 2011-11-14 23:23:21
回答 3查看 53.8K关注 0票数 25

有没有一种.dll可以让我使用它作为输入和输出?我想从PDF转换为HTML。我的同事说,从PDF中获取文本/字体/图像/边距/链接等,然后创建具有相同内容的新HTML文件,一步一步地进行非常困难。他说这几乎是不可能的。所以我在想--有没有什么dll可以供我参考呢?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-11-14 23:29:39

写一个程序来做这件事绝对不是一件容易的事。如果您找不到任何.NET库来做这件事(我不能,至少不是免费的),我会直接download this并以编程方式调用它来获得我的html。

如果您有空闲的时间,并且/或者PDFToHtml没有为您生成可接受的输出,您可以使用use iText自己编写程序。它是一个非常成熟的免费pdf库。我过去曾用它来操作PDF(合并、创建等)。

更新

正如Quandary在评论中指出的那样,与iText提供的商业或PDFSharp许可相比,AGPL库提供了一个更宽松的许可(MIT)。在选择您的库时请牢记这一点。我自己没有使用过PDFSharp库,我不知道它们在功能方面的比较。

票数 12
EN

Stack Overflow用户

发布于 2011-11-14 23:30:30

你可以下载这个免费的工具:PDFToHTML

然后,在您的程序中,只需派生一个新进程并运行传递PDF文件的可执行文件。我现在刚刚测试了一下,它看起来工作正常。

票数 8
EN

Stack Overflow用户

发布于 2011-11-14 23:28:33

如果您不介意付费,Aspose提供了一个非常好的解决方案,这就是我们公司使用的解决方案。

http://www.aspose.com/categories/.net-components/aspose.pdf-for-.net/key-features.aspx

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8123786

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档