我开始学习Lucene,所以我正在阅读Lucene的行动。本书有关字段的摘录如下:
Keyword—Isn’t analyzed, but is indexed and stored in the index verbatim.
This type is suitable for fields whose original value should be preserved in
its entirety, such as URLs, file system paths, dates, personal names, Social
Security numbers, telephone numbers, and so on我从这里理解的是,如果一个文本被关键字字段索引,它不会被分析(不是分裂成标记),而是被索引。然而,我不明白的是and stored in the index verbatim在哪里。
我对存储在索引中感到困惑。我假设如果对文本进行索引,它将被存储在索引数据结构中。
有谁能给我举个例子解释一下吗?
发布于 2015-10-20 18:58:37
我想你一定是在读“行动中的卢塞尼”的第一版。那本书已经11年了,已经过时了。我不会太担心理解Lucene1.4的约定。
第二版是可用的。它有五年的历史,是基于Lucene3.0的,所以它肯定有点过时了,特别是在Lucene版本4.0的巨大变化之后,但并不是无可救药。读这些当然会更有用。
但是,存储和索引字段之间的区别仍然存在。用Lucene的话说:
StringField)不进行分析,但它们是索引的,因此它们的完整内容可以在不进行标记化的情况下搜索。IndexSearcher.doc(int)获得的搜索结果),您返回的文档中只会有存储字段。因此,您可以有一个可以搜索但不会在结果中返回的字段,也可以有一个在结果中返回但不能搜索的字段。
https://stackoverflow.com/questions/33242356
复制相似问题