如何自定义Plone搜索引擎以实现excel文件的全文索引?我已经安装了pdftotext和wv的pdf,word文件全文索引。
发布于 2014-04-18 14:49:04
如果将Products.OpenXml添加到实例鸡蛋中并以Plone安装,则可以索引现代Office格式,至少.docx和.xlsx是这样的。对于普通的旧Excel (.xls)文件,此操作不起作用。
几周前,我在一个4.3.2构建配置中尝试了它:
[instance]
eggs =
...
Products.OpenXml
[versions]
# You need a more recent lxml than default Plone, some 3.x version
lxml = 3.3.3
Products.OpenXml = 1.1.1另外,也可以使用Products.AROfficeTransforms。我只是将它与Products.OpenXml结合使用,但是如果您只对旧的excel工作表感兴趣,Products.AROfficeTransforms本身就足够了,.xls。在构建配置中:
[instance]
eggs =
...
Products.AROfficeTransforms
[versions]
Products.AROfficeTransforms = 0.11.0它要求在系统上安装xlhtml二进制文件。这是一个古老的二进制,上一次改变是在2002年。我没有亲自安装。
发布于 2014-04-24 09:30:06
试试ftw.tika
支持格式:
它基于apache,并作为一个由主管管理的服务运行(您必须扩展构建出来)。
它与portal_transforms集成,经过很好的测试和文档化。
更多信息:
https://stackoverflow.com/questions/23151319
复制相似问题