首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Java搜索Ms-word文件的内容

使用Java搜索Ms-word文件的内容
EN

Stack Overflow用户
提问于 2011-11-01 17:04:42
回答 3查看 3.4K关注 0票数 2

我的要求是从放置在同一文件夹中的多个MS-word或Ms-Excel文件中搜索内容。我如何使用java技术实现这一点?请给我一个概述。

谢谢

EN

回答 3

Stack Overflow用户

发布于 2011-11-01 17:10:55

您可以充分利用可用的第三方组件,例如Apache POI(免费)或ASPOSE(付费)。他们的文档应该指定在MS文档中检索数据的方式。

请参阅:How to read content from ms word files using Jakarta POI

票数 1
EN

Stack Overflow用户

发布于 2011-11-01 17:14:12

可以使用Apache Tika轻松地提取microsoft word文件的内容并搜索整个文本。

示例代码-

代码语言:javascript
复制
File f = new File("path to file");
FileInputStream is = new FileInputStream(f);
ContentHandler contenthandler = new BodyContentHandler();
Metadata metadata = new Metadata();
metadata.set(Metadata.RESOURCE_NAME_KEY, f.getName());
Parser parser = new AutoDetectParser();
parser.parse(is, contenthandler, metadata);
System.out.println(metadata.get(Metadata.TITLE));
System.out.println(contenthandler.toString());

您可以搜索内容所在的contenthandler.toString()。

票数 1
EN

Stack Overflow用户

发布于 2011-11-01 19:20:48

您可以分别尝试Aspose.Words for Java和Aspose.Cells for Java to extract contents from Microsoft Wordget data from Microsoft Excel文档。请注意,这两个组件不需要在开发或部署计算机上安装Microsoft Office。你可以在你那端使用try these file processing components

披露:我是Aspose的开发者布道者。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7964348

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档