我目前正在处理新的德国ZUGFeRD文件。这些是PDF / A/3文件,其中有一个嵌入的XML文件,其中包含数据。
我想从PDF /3中提取这个XML文件,使用C#使用ABAPDV8.1。
知道怎么做吗?
非常感谢和问候,
发布于 2014-02-11 16:27:35
我不知道libs pdf,但我想,pdf libs提供类似的访问pdfs内容。
首先来看一下1p0.pdf。尤其是第112页。这些图像显示了要找到xml流必须遍历的对象树。
有了这棵树,你就有了名字、类型和方向。现在,您可以遍历pdf对象树,以获得您正在寻找的XML内容。
基于图表的步骤。
AF的数组AF数组获取第一个元素(应该是file spec)file spec获得名为EF的字典EF的流内容为了获得内容,需要执行以下步骤。
为了显示pdf的结构和浏览树,我建议使用像iText鲁普这样的工具
发布于 2014-02-12 10:39:08
我做了什么abcpdf:
https://stackoverflow.com/questions/21698794
复制相似问题