我们想使祖格夫发票的处理自动化。是否有一种方法可以使用Ghostscript提取和保存嵌入在PDF中的xml文件?
发布于 2022-03-22 02:06:54
正如KenS所提到的,Ghostscript可以帮助组装Zugferd文件,但不能提取内容。下面我们可以看到这些内容在源xml (较低)和一个好!?在这里,纯文本是可见的(图像的上部是PDF在WordPad中查看),可以很容易地提取为文本。然而,有关PDF提取的任何内容都不是可靠的,因为一个PDF的格式很少与下一个相同,除非您这样做。
许多PDF阅读器能够导出源文件这样的附件,许多PDF库将允许以脚本的方式提取命名文件。

以上示例来自当前最新的开放源码Java应用程序https://www.mustangproject.org/
对于非常简单的跨平台使用,有pdfdetach,它可以按名称或所有附件保存任何附件。

https://stackoverflow.com/questions/71560064
复制相似问题