首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >xdmp:在MarkLogic中使用DOCX的word转换()

xdmp:在MarkLogic中使用DOCX的word转换()
EN

Stack Overflow用户
提问于 2018-05-17 12:31:33
回答 1查看 94关注 0票数 0

我正在尝试使用xdmp:word-转换()函数来转换我的二进制文档(DOCX文件)--它将引发以下错误。

您要转换的文件格式不正确。DHF-INVFILE: xdmp:word-convert(fn:doc("/content/aplc/binary/13599668870066633077.docx"),"13599668870066633077.docx",true.) --您要转换的文件格式不正确。input=/var/opt/MarkLogic/Temp/0b71d7278e82c553/toconv.doc

我的代码如下

代码语言:javascript
复制
xdmp:word-convert(
     $xml-input,
     fn:concat(xdmp:hash64("Sample.docx"),".docx"),
     <options xmlns="xdmp:word-convert" xmlns:tidy="xdmp:tidy">
          <tidy>true</tidy>
          <tidy:clean>yes</tidy:clean>
          <tidy:drop-empty-paras>yes</tidy:drop-empty-paras>
          <tidy:drop-font-tags>yes</tidy:drop-font-tags>
          <tidy:hide-comments>yes</tidy:hide-comments>
          <tidy:output-html>no</tidy:output-html>
          <tidy:output-xhtml>no</tidy:output-xhtml>
          <tidy:output-xml>yes</tidy:output-xml>
          <compact>true</compact>
      </options>)

其中相同的代码在.doc扩展中非常好地工作。

如果xdmp:word-转换()将无法处理DOCX文件,那么除了xdmp:document-filter之外,还有哪些其他可能的API函数将执行类似的工作。

EN

回答 1

Stack Overflow用户

发布于 2018-05-17 15:10:37

xdmp:word-convert上的医生说:

不转换Microsoft 2007及更高版本的文档。

对于最近的办公文档,您可以查看如何在office OpenXML提取管道中使用CPF,这里还提到了:https://stackoverflow.com/a/11248525/918496

哈哈!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50391556

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档