我使用了一点Alfresco,Apache Tika上面有一个很薄的抽象层,用于从文档中提取元数据。
我决定只使用Jackrabbit,因为我不需要这么健壮的解决方案。但是除了jackrabbit text-提取器模块之外,我没有看到任何其他对文档元数据(Dublin核心属性)的支持。
更详细地说,jackrabbit text-提取器maven artiface2.0版-快照似乎不在SVN主干中。
有人能告诉我该选择哪种方法吗?
发布于 2011-03-01 07:50:17
我的理解是,现在的杰克兔使用tika进行文本提取。
https://stackoverflow.com/questions/5148933
复制相似问题