我目前正在用Java语言实现Oracle and Export工具,以提取不同文件的元数据和内容。我可以对一个文件夹中的多个文件执行此操作,但是我无法提取嵌入到另一个文件中的文件。我想知道这在搜索和导出中是否可能。
如果没有,我会选择CleanContent,但它只接受微软和PDF文件。
发布于 2013-05-01 03:04:29
搜索导出可以从存档或其他类型的文件中转换或提取嵌入的文件。我们区分了三种不同类型的嵌入,每种嵌入都有自己的选项来控制它们的转换。这三种类型是存档子文档、电子邮件附件和通用嵌入。默认情况下,前两个是转换的,但第三个不是。要启用泛型嵌入转换,请在SCCOPT_XML_SEARCHML_FLAGS选项中设置SCCEX_XML_EMBEDDINGS标志。如果您使用的是随SDK提供的导出器示例应用程序,请尝试在CFG文件中启用以下内容。
嵌入标志是
如果您试图提取嵌入的二进制副本,则需要三个步骤。在初始转换时,在SCCOPT_XML_SEARCHML_FLAGS选项中设置SCCEX_XML_PRODUCEOBJECTINFO标志。将该信息用于所需的嵌入,以填充传递给DAOpenDocument的SCCDAOBJECT结构。可以将从该函数返回的hDoc传递给DASaveInputObject以保存嵌入的二进制副本。这适用于上述三种类型的嵌入中的任何一种。没有演示此过程的Java示例应用程序。
https://stackoverflow.com/questions/16202683
复制相似问题