我正在开发一个web应用程序,该应用程序以MS文档(word、excel、ppt)为输入文档并生成PDF文档,同时可以使用我目前正在使用的API/库创建可访问的PDF,我正在寻找一个API/library,它将帮助我扫描输入文档(word、ppt、excel)以满足可访问性要求。
如果输入文档本身缺乏可访问性的语义元数据,则生成的PDF将无法访问。
发布于 2022-03-15 09:09:31
MS本身有一个用于VBscript (Windows/Mac)和AppleScript (仅限Mac)的脚本接口。不知道你能用这些文件达到多远,但我似乎记得它们都暴露了很多关于Word文档的东西,所以这是一种可能的途径。
libreoffice有一个python脚本接口--这可能是另一种可行的方法。
当然,有一些命令行工具可以以各种方式操作word文件。试试这篇文章:
https://stackoverflow.com/questions/71478365
复制相似问题