我们有一个需求,即结构化数据和非结构化数据都进入系统。我们需要对两者都进行索引,然后启用搜索功能。我们在Hadoop平台上使用SolrCloud。对于结构化数据,我们计划将数据放入HBase中,而非结构化数据则直接放入HDFS中。
我的问题是如何在单个Solr核心下索引这些源?这是否可能在SolrCloud中将结构化和非结构化数据都索引到单个核心/集合中,然后启用该索引上的搜索功能?
提前谢谢。
发布于 2015-03-30 12:07:33
您最多可以拥有一个Solr模式,它包含所有可能的字段名,即您的结构化和非结构化数据。还请注意,既然您提到了非结构化的,您可以将更多的字段名附加到现有的架构文件中。如果您不能添加字段,那么您需要考虑其他方法来使其成为可能。
因此,对于结构化数据,只需填充特定于结构化数据的字段的值,其余字段则不受影响。
对于Solr中的单个核心和索引,上述说明实际上是如何拥有不同结构的不同文档。
如果你的问题有不同的意思,请回电给我。
https://stackoverflow.com/questions/29334093
复制相似问题