首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >绘制全文索引Excel文件

绘制全文索引Excel文件
EN

Stack Overflow用户
提问于 2014-04-18 09:31:07
回答 2查看 735关注 0票数 4

如何自定义Plone搜索引擎以实现excel文件的全文索引?我已经安装了pdftotext和wv的pdf,word文件全文索引。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-04-18 14:49:04

如果将Products.OpenXml添加到实例鸡蛋中并以Plone安装,则可以索引现代Office格式,至少.docx和.xlsx是这样的。对于普通的旧Excel (.xls)文件,此操作不起作用。

几周前,我在一个4.3.2构建配置中尝试了它:

代码语言:javascript
复制
[instance]
eggs =
    ...
    Products.OpenXml

[versions]
# You need a more recent lxml than default Plone, some 3.x version
lxml = 3.3.3
Products.OpenXml = 1.1.1

另外,也可以使用Products.AROfficeTransforms。我只是将它与Products.OpenXml结合使用,但是如果您只对旧的excel工作表感兴趣,Products.AROfficeTransforms本身就足够了,.xls。在构建配置中:

代码语言:javascript
复制
[instance]
eggs =
    ...
    Products.AROfficeTransforms

[versions]
Products.AROfficeTransforms = 0.11.0

它要求在系统上安装xlhtml二进制文件。这是一个古老的二进制,上一次改变是在2002年。我没有亲自安装。

票数 5
EN

Stack Overflow用户

发布于 2014-04-24 09:30:06

试试ftw.tika

支持格式:

  • Microsoft格式(Office )
  • *.docx Word文档
  • *.dotx Word模板
  • *.xlsx Excel表格
  • *.xltx Excel模板
  • *.pptx幻灯片演示文稿
  • *.potx Powerpoint模板
  • *.ppsx Powerpoint幻灯片
  • 旧的Microsoft Office (97)格式
  • 富文本格式
  • OpenOffice ODF格式
  • OpenOffice 1.x格式
  • 常见的Adobe格式(InDesign、Illustrator、Photoshop)
  • PDF文件
  • WordPerfect文档-电子邮件

它基于apache,并作为一个由主管管理的服务运行(您必须扩展构建出来)。

它与portal_transforms集成,经过很好的测试和文档化。

更多信息:

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23151319

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档