我们有Microsoft文档的结构,以便使用沃森文档会话服务生成高质量的RaR JSON应答单元。但是,Word文档中的任何工作链接都将由Doc服务在生成的JSON应答单元中删除,这只是平面文本。
是否有一种方法来配置Doc服务以保留这些链接,从而使链接HTML出现在结果的JSON应答单元中?如果没有,您建议我们如何继续获取具有工作链接的Word文档到我们的RaR语料库。
发布于 2016-11-28 19:52:50
当前,Doc (特别是Microsoft和Docx转换)删除外部链接。内部链接被保存下来。
不幸的是,没有任何配置设置来保留外部链接。
https://stackoverflow.com/questions/40832654
复制相似问题