我想转换我的pdf文件,其中只包含文本到html格式。我想检索内容(文本、格式、缩进等)。并将其存储在变量中,以便以相同的格式、排列、缩进显示。
有没有人能推荐一个我可以使用的PHP类/库(不是软件工具,不需要安装)?
谢谢
发布于 2012-02-20 16:57:36
pdf2text给出了它所说的:它从pdf文件中提取文本标记,而不是将其转换为html 。为此,您可能需要使用命令行工具或在线服务。
有linux命令行pdftohtml工具
Poppler是另一种选择,它包含一个名为pdftohtml的实用程序
或者,如果您准备考虑java应用程序,也可以使用jPedal
也有一系列的商业应用可以做到这一点,但我猜你想要“免费”
发布于 2012-02-20 22:54:46
您可以使用FPDI - PDF-Parser (COMERCIAL)从您的pdf文件导入文本,或使用FPDI (免费)导入类似pdf模板的文本(您不能在免费版本中修改文本)。或者您可以存储一些html格式的模板和短码,并使用TCPDF: Open Source PHP Class创建新的pdf。
https://stackoverflow.com/questions/9358252
复制相似问题