我已经使用itextsharp创建了一个带有表的pdf。我在http://itextsharp.sourceforge.net/tutorial/ch05.html上找到了一个例子。现在,我想再次使用itextsharp从表中读取数据。我找不到任何有关如何读取此数据的文档。谁能给我举个例子?
发布于 2010-02-09 07:43:31
不幸的是,你不能在iTextSharp中做到这一点。在SourceForge题为"Advanced: reading PDF" on the iTextSharp page的章节中说:
pdf格式只是一张画布,其中放置的文本和图形没有任何结构信息。因此,PDF文件中没有任何“iText-objects”。在每个页面中可能会有一些“字符串”,但你不能使用这些字符串来重构一个短语或一个段落。可能绘制了许多线条,但是您不能基于这些线条检索Table对象。简而言之:用iText解析PDF文件的内容是不可能的。把你的问题发布在新闻组news://comp.text.pdf上,也许你会从一些人那里得到一些答案,这些人已经构建了可以解析PDF并提取其中一些内容的工具,但不要指望工具能将其转换为结构化文本。
发布于 2010-07-24 18:47:37
我还需要从PDF中读取数据。我最终所做的是将PDF转换为文本,然后对结果进行字符串解析以获得数据。
在我的场景中,我想获取表中的数据并将其转换为Excel。
https://stackoverflow.com/questions/2206454
复制相似问题