我的要求是从放置在同一文件夹中的多个MS-word或Ms-Excel文件中搜索内容。我如何使用java技术实现这一点?请给我一个概述。
谢谢
发布于 2011-11-01 17:10:55
您可以充分利用可用的第三方组件,例如Apache POI(免费)或ASPOSE(付费)。他们的文档应该指定在MS文档中检索数据的方式。
请参阅:How to read content from ms word files using Jakarta POI
发布于 2011-11-01 17:14:12
可以使用Apache Tika轻松地提取microsoft word文件的内容并搜索整个文本。
示例代码-
File f = new File("path to file");
FileInputStream is = new FileInputStream(f);
ContentHandler contenthandler = new BodyContentHandler();
Metadata metadata = new Metadata();
metadata.set(Metadata.RESOURCE_NAME_KEY, f.getName());
Parser parser = new AutoDetectParser();
parser.parse(is, contenthandler, metadata);
System.out.println(metadata.get(Metadata.TITLE));
System.out.println(contenthandler.toString());您可以搜索内容所在的contenthandler.toString()。
发布于 2011-11-01 19:20:48
您可以分别尝试Aspose.Words for Java和Aspose.Cells for Java to extract contents from Microsoft Word和get data from Microsoft Excel文档。请注意,这两个组件不需要在开发或部署计算机上安装Microsoft Office。你可以在你那端使用try these file processing components。
披露:我是Aspose的开发者布道者。
https://stackoverflow.com/questions/7964348
复制相似问题