各位程序员!我用tika提取了一个ppt文件,它只有普通的text.However,结果tika给出的内容类型是一个jpg格式!所以我的问题是如何处理它,因为我只希望这种情况被检测为纯文本类型。
发布于 2018-01-11 13:50:03
我在tika中更改了一些源代码,这样我就可以通过这种方式获取我want.In的内容,我提取ppt文件并获得正确的结果。
https://stackoverflow.com/questions/47900990
相似问题