我想要识别一个pdf文件中的表格。在C#中使用了什么SDK来识别pdf中的表,以及一些逐个单元格读取的机制,有人能推荐一下吗?
发布于 2011-08-06 12:39:58
PDF Sharp很好,而且是免费的。我从来没有具体这样做过,但它确实与PDF格式中的所有主要对象相关。
发布于 2011-08-13 23:58:19
表格不会作为结构存在于PDF中,除非它是作为带有附加标签的标记内容创建的。我在http://www.jpedal.org/PDFblog/2009/04/pdf-text/上写了一篇博客文章,解释了从PDF文件中提取文本的一些问题。
https://stackoverflow.com/questions/6964787
复制相似问题