首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >自动解析XML并将docx转换为pdf

自动解析XML并将docx转换为pdf
EN

Stack Overflow用户
提问于 2020-01-17 02:39:53
回答 1查看 109关注 0票数 0

我已经有很多年没有编程了,但需要让下面的过程自动化。

一家政府医药机构在其网站上发布了一个xml文件。我需要下载它并解析它,然后捕获其中一个字段,该字段包含一个docx文件的url。然后,我需要将其作为pdf存储在本地文件系统中。需要每隔n天重复一次此过程。

我过去对PHP非常了解,但对于这项任务来说,什么是可以的。python会不会更好。因为我在工作中没有服务器,所以我想买一个树莓派。

你对我该怎么做有什么建议?

我有一些想法,可以通过cron作业使用wget或curl来获取xml文件。然后使用php、python或bash解析xml文件,使用wget或curl nad调用docx,然后使用pdf命令行工具。如果它在网站上,我应该将结果加载到sql数据库中,还是只将它们作为目录中的文件列出。

会很感激你的任何想法。

马丁

EN

回答 1

Stack Overflow用户

发布于 2020-01-17 02:51:47

就我个人而言,我会选择node.js。在raspberry pi上设置节点服务器很容易,而且node.js有一个库,可以用来做任何事情。有很多简单的安装教程,所以有很多像xml parsing in node这样的信息。用JavaScript编写代码非常容易。

例如,如果你需要一个docx转换器,这里有一个:mammoth.js

祝好运!

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59775896

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档