我是Lucene.NET的新手,但我使用的是为Sitecore构建的开源工具,它使用Lucene.NET来索引CMS中的许多内容。昨天我确认,当我重建我的索引时,当前的索引文件会擦除,所以任何依赖索引的东西都不会在30-60秒内获得任何数据(整个索引重建所需的时间)。在新索引完全重建之前,是否有最佳做法或方法使Lucene.NET不覆盖当前索引文件?我基本上是在想,我希望它能写入新的临时索引文件,当重建完成后,让这些文件覆盖当前的索引。
我所说的例子:
提前感谢
发布于 2011-01-07 15:31:24
我对“塞特雷”本身没有经验,但我的故事如下。
我们最近将基于索引的搜索(使用Lucene.Net)合并到我们的eCommerce子系统中。对于我们的情况,索引更新过程可能需要大约半个小时(~50,000种产品本身+大量相关信息)。为了防止在更新索引期间出现“拒绝服务”响应,我们首先创建一个it的“备份”版本(只需将索引目录复制到另一个位置),然后将所有进一步的请求重定向到使用此“备份”版本。完成索引更新后,我们删除备份,以便客户端开始使用更新(或“活动”)版本的索引。这也有助于在更新过程中出现任何未处理的异常,因为您可能最终会出现没有索引的情况(在我们的例子中,客户端总是可以使用“备份”版本)。
API参考 (Lucene2.4)的Lucene.Net.Index.IndexWriter对象声明如下:
请注意,即使读者正在使用索引,也可以使用
create=true打开索引。老读者将继续搜索他们打开的“时间点”快照,在重新打开之前不会看到新创建的索引。
因此,至少您不应该担心当前正在索引中搜索的客户机。
希望这能帮助你做出正确的决定。
发布于 2011-01-07 15:34:18
我不太熟悉这个Lucene.Net工具,但是我可以回答如何使用纯NRT:您应该使用一个NRT设置,这意味着“有一个索引编写器,并且永远不要关闭它”。
基本上,索引编写者在内存中有一个“虚拟”索引,直到它被刷新到磁盘。因此,只要你从作者那里得到你的读者,你就会看到最新的东西,即使它还没有被冲到磁盘上。
https://stackoverflow.com/questions/4626640
复制相似问题