首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >大型文档的实体抽取

大型文档的实体抽取
EN

Stack Overflow用户
提问于 2018-04-28 16:23:37
回答 1查看 119关注 0票数 0

我需要从word和pdf文档中提取实体。文件可在10至20页范围内。是否有可扩展的库/API可供我们插入处理管道?任何对不同解决方案的比较研究都是有帮助的。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-04-30 13:35:47

看看沃森自然语言理解 (您需要获得一个IBM,然后登录查看这个内容-别担心,成本是0美元)。使用沃森自然语言理解,您将需要查看API资源管理器,以找到用于获取所需结果的正确的API资源管理器语法。

我还注意到其中提到了Word/PDF文件。您将需要转换使用沃森发现号服务的文档,然后可以将转换后的文档传递给沃森自然语言理解,后者接受JSON、文本或HTML输入。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50078649

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档