我已经有很多年没有编程了,但需要让下面的过程自动化。
一家政府医药机构在其网站上发布了一个xml文件。我需要下载它并解析它,然后捕获其中一个字段,该字段包含一个docx文件的url。然后,我需要将其作为pdf存储在本地文件系统中。需要每隔n天重复一次此过程。
我过去对PHP非常了解,但对于这项任务来说,什么是可以的。python会不会更好。因为我在工作中没有服务器,所以我想买一个树莓派。
你对我该怎么做有什么建议?
我有一些想法,可以通过cron作业使用wget或curl来获取xml文件。然后使用php、python或bash解析xml文件,使用wget或curl nad调用docx,然后使用pdf命令行工具。如果它在网站上,我应该将结果加载到sql数据库中,还是只将它们作为目录中的文件列出。
会很感激你的任何想法。
马丁
发布于 2020-01-17 02:51:47
就我个人而言,我会选择node.js。在raspberry pi上设置节点服务器很容易,而且node.js有一个库,可以用来做任何事情。有很多简单的安装教程,所以有很多像xml parsing in node这样的信息。用JavaScript编写代码非常容易。
例如,如果你需要一个docx转换器,这里有一个:mammoth.js
祝好运!
https://stackoverflow.com/questions/59775896
复制相似问题