我们正在寻找一种可以将PDF文档转换为XML数据的企业解决方案。
我对任何解决办法都没有意见;
发布于 2014-02-20 05:42:27
您可以使用Apache读取pdf文档内容,然后以某种方式将其转换为XML。可能会创建Apache路由,在文件夹中读取文档,然后使用Tika提取内容,然后将其作为XML输出到其他地方。
https://stackoverflow.com/questions/21899089
相似问题