有没有一种.dll可以让我使用它作为输入和输出?我想从PDF转换为HTML。我的同事说,从PDF中获取文本/字体/图像/边距/链接等,然后创建具有相同内容的新HTML文件,一步一步地进行非常困难。他说这几乎是不可能的。所以我在想--有没有什么dll可以供我参考呢?
发布于 2011-11-14 23:29:39
写一个程序来做这件事绝对不是一件容易的事。如果您找不到任何.NET库来做这件事(我不能,至少不是免费的),我会直接download this并以编程方式调用它来获得我的html。
如果您有空闲的时间,并且/或者PDFToHtml没有为您生成可接受的输出,您可以使用use iText自己编写程序。它是一个非常成熟的免费pdf库。我过去曾用它来操作PDF(合并、创建等)。
更新
正如Quandary在评论中指出的那样,与iText提供的商业或PDFSharp许可相比,AGPL库提供了一个更宽松的许可(MIT)。在选择您的库时请牢记这一点。我自己没有使用过PDFSharp库,我不知道它们在功能方面的比较。
发布于 2011-11-14 23:30:30
你可以下载这个免费的工具:PDFToHTML
然后,在您的程序中,只需派生一个新进程并运行传递PDF文件的可执行文件。我现在刚刚测试了一下,它看起来工作正常。
发布于 2011-11-14 23:28:33
如果您不介意付费,Aspose提供了一个非常好的解决方案,这就是我们公司使用的解决方案。
http://www.aspose.com/categories/.net-components/aspose.pdf-for-.net/key-features.aspx
https://stackoverflow.com/questions/8123786
复制相似问题