首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >TIKA服务器提取嵌入式资源

TIKA服务器提取嵌入式资源
EN

Stack Overflow用户
提问于 2020-01-12 16:45:58
回答 1查看 189关注 0票数 0

我正在使用TIKA-app (v 1.23)进行一些测试,以便从输入文件中提取嵌入式资源,通过使用app在命令行中指定-z参数,这样做的效果很好。此参数启用嵌入式资源提取,并将资源写入工作目录。现在,我想使用基于TIKA-server的这个功能。但是,我在文档中还没有找到正确的方法,我想知道TIKA的服务器变体提供了这个选项吗?

那么,如何使用TIKA-server应用程序提取嵌入式资源呢?请注意,我找的不是嵌入式资源的内容,而是实际的二进制文件数据(我想将附件从输入文件中分离出来)

EN

回答 1

Stack Overflow用户

发布于 2020-11-12 03:23:43

的/unpack端点也提供了类似的功能。如果将其与X PDFExtractInlineImage头部设置为true相结合,它将执行等效的处理。

例如:

代码语言:javascript
复制
curl -T test.pdf http://localhost:9998/unpack > test.zip --header "X-Tika-PDFExtractInlineImages: true"

将返回包含ZIP中所有图像的ZIP文件。

您可以阅读更多关于端点这里的信息。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59705993

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档