我的任务是创建一个像Ngram视图/图表这样的数据集。这张图表只是一张线条图,基本上是一段时间内的术语(符号)。
我没有使用SOLR的任何经验,但我已经得到了一个包含大量数据的核心,并且知道我需要使用Shingles来提取数据,它显然已经被索引用于使用Ngram,尽管我需要知道确切的内容。
所以我想我可以得到整个数据的Ngram/shingle,但是随着时间的推移,我如何得到结果,比如说在五年内每个月的结果?数据是报纸数据,所以日期和日期是索引的一部分,全文也是如此。
是否有一个SOLR调用来获得数据随时间的推移,或者我是否应该在每一天/每个月对Solr执行许多请求?
如有任何建议或经验,将不胜感激。
发布于 2014-08-26 17:47:02
当索引内容时,通常会执行标记和ngram,因为您希望将这些标记或ngram单独索引以获得它们的任何有用计数。您可以在字段上使用faceting生成这些计数,但随着时间的推移,最简单的方法是按您已经猜到的那样发出几个查询。您可以使用筛选器查询(&fq=)来限制返回的集合(如果没有其他用途,则只使用常规的q= )。
如果不了解您的内容、如何编制索引以及您想要返回哪些内容,就很难说出更多的信息。
https://stackoverflow.com/questions/25504935
复制相似问题