针对StormCrawler的Apache Tika集成是否支持文档的语言检测?有没有Tika生成的变量列表,我可以将其包含在StormCrawler的输出中?
发布于 2020-12-26 18:02:40
简短的回答是不,但你可以使用the module instead,上次我检查过它比Tika更快,有更多的语言,更准确。
我不知道Tika返回的值的详尽列表。
https://stackoverflow.com/questions/65454629
相似问题