首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Tika信息抽取

Tika信息抽取
EN

Stack Overflow用户
提问于 2012-08-16 14:16:52
回答 1查看 395关注 0票数 1

我可以知道如何使用Tika在网页中提取表格形式的信息,如数字吗?为此,Tika有解析器吗?

谢谢

EN

回答 1

Stack Overflow用户

发布于 2012-08-16 14:21:33

你可以在tika中提取网页。为此,您可以使用apache-tika's HTMLParser。你会得到你需要的一切here

你也可以使用autodetect content type and extract contentAutoDetectParserAutoDetectParser可以检测任何类型的文件/url,并将应用提取。

我可以知道如何使用Tika在网页中提取表格形式的信息,如数字吗?

--> tika提取的内容类似于raw文本。我不认为你会以表格的形式得到它。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11981658

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档