文章/答案/技术大牛

发布

社区首页 >问答首页 >自动解析XML并将docx转换为pdf

问自动解析XML并将docx转换为pdf
EN

Stack Overflow用户

提问于 2020-01-17 02:39:53

回答 1查看 109关注 0票数 0

我已经有很多年没有编程了，但需要让下面的过程自动化。

一家政府医药机构在其网站上发布了一个xml文件。我需要下载它并解析它，然后捕获其中一个字段，该字段包含一个docx文件的url。然后，我需要将其作为pdf存储在本地文件系统中。需要每隔n天重复一次此过程。

我过去对PHP非常了解，但对于这项任务来说，什么是可以的。python会不会更好。因为我在工作中没有服务器，所以我想买一个树莓派。

你对我该怎么做有什么建议？

我有一些想法，可以通过cron作业使用wget或curl来获取xml文件。然后使用php、python或bash解析xml文件，使用wget或curl nad调用docx，然后使用pdf命令行工具。如果它在网站上，我应该将结果加载到sql数据库中，还是只将它们作为目录中的文件列出。

会很感激你的任何想法。

马丁

python

xml

pdf

php

回答 1

Stack Overflow用户

发布于 2020-01-17 02:51:47

就我个人而言，我会选择node.js。在raspberry pi上设置节点服务器很容易，而且node.js有一个库，可以用来做任何事情。有很多简单的安装教程，所以有很多像xml parsing in node这样的信息。用JavaScript编写代码非常容易。

例如，如果你需要一个docx转换器，这里有一个：mammoth.js

祝好运!

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59775896

复制

相似问题

问自动解析XML并将docx转换为pdf
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问自动解析XML并将docx转换为pdfEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问自动解析XML并将docx转换为pdf
EN