首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >LucidWorks搜索引擎索引应该占用多少存储空间?

LucidWorks搜索引擎索引应该占用多少存储空间?
EN

Stack Overflow用户
提问于 2011-10-09 00:17:17
回答 1查看 257关注 0票数 0

我正在尝试使用LucidWorks (http://www.lucidimagination.com/products/lucidworks-search-platform)作为我的组织内部网的搜索引擎。我想要它从各种数据源(web & wiki,文件系统,Subversion存储库)索引各种文档类型(Office格式,PDF,网页)。到目前为止,我尝试了索引几个站点、目录和存储库(大约500K文档,总大小约为50 So )-索引的大小为155 So。

这是否合理呢?索引是否应该占用比数据本身更多的存储空间?数据大小与索引大小比率的合理经验法则是什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-10-09 02:04:17

没有合理的索引大小,基本上取决于你所拥有的数据。

理想情况下应该更少,但没有经验法则。

但是,对于索引大小和数据大小,取决于对数据进行索引的方式。

许多因素将决定并影响您的索引大小。

索引中的大部分空间被存储的数据字段占用。

如果对文档中的数据进行索引,并且所有内容都已存储,则索引大小肯定会增长。

对索引字段属性的微调也有助于节省空间。

您可能希望重新访问需要索引和存储的字段。

另外,您是否使用了大量的复制字段来复制数据或维护重复数据。优化也可能会有所帮助。

更多信息@ http://wiki.apache.org/solr/SolrPerformanceFactors

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7698117

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档