我正在使用这个项目:任何人都知道在哪个值中保存正在处理的文档的名称(或路径)。我希望将此值检索到Solr (将一个字段及其名称添加到我的架构中)。这个是可能的吗?
示例:我希望能够看到文档的名称,查询从中返回相同的结果。
我使用以下命令运行该项目:
hadoop jar solr-hadoop-job-2.2.5.jar
com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true -DcsvDelimiter=
-cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1
- i /usr/local/hadoop/input
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat
-s http://127.0.1.1:8983/solr发布于 2016-09-22 00:09:43
这对我起了作用:
hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="\\w+"
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match_ss
-cls com.lucidworks.hadoop.ingest.RegexIngestMapper
-c collection1 -i /path/* -s http://127.0.1.1:8983/solr
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat 更多信息请参见这。
https://stackoverflow.com/questions/39598215
复制相似问题