首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在ElasticSearch 5.5中使用ingest插件时获得条件向量?

如何在ElasticSearch 5.5中使用ingest插件时获得条件向量?
EN

Stack Overflow用户
提问于 2017-09-12 22:17:44
回答 1查看 210关注 0票数 0

全,

我有下面的代码来使用elasticsearch中的ingest索引一个文件

代码语言:javascript
复制
public class Document
{
  public string Id { get; set; }
  public string Content { get; set; }
  public Attachment Attachment { get; set; }
}

var indexResponse = client.CreateIndex("documents", c => c
  .Settings(s => s
    .Analysis(a => a
     .TokenFilters(f=>f.Stemmer("english_stem",st=>st.Language("english")).Stop("english_stop",sp=>sp.StopWords("_english_")))
     .CharFilters(cf => cf.PatternReplace("num_filter", nf => nf.Pattern("(\\d+)").Replacement(" ")))                
     .Analyzers(an => an.Custom("tm_analyzer", ta => ta.CharFilters("num_filter").Tokenizer("standard").Filters("english_stem","english_stop","lowercase")))))
  .Mappings(m => m
             .Map<Document>(mm => mm
              .AllField(al=>al.Enabled(false))
              .Properties(p => p                 
               .Object<Attachment>(o=>o
                .Name(n=>n.Attachment)
                .Properties(ps=>ps
                 .Text(s => s
                  .Name(nm => nm.Content)
                  .TermVector(TermVectorOption.Yes)
                  .Store(true)
                  .Analyzer("tm_analyzer")))))));

client.PutPipeline("attachments", p => p
  .Description("Document attachment pipeline")
  .Processors(pr => pr
    .Attachment<Document>(a => a
      .Field(f => f.Content)
      .TargetField(f => f.Attachment)
    )
    .Remove<Document>(r => r
      .Field(f => f.Content)
    )
  )
);

var base64File = Convert.ToBase64String(File.ReadAllBytes("file1.xml"));
client.Index(new Document
{
  Id = "file1.xml", 
  Content = base64File
}, i => i.Pipeline("attachments"));

如您所见,我已经将内容字段的术语向量otpion设置为yes。但是,当我像下面这样使用邮递员查询或在C#鸟巢查询时,我什么也得不到

代码语言:javascript
复制
POST /documents/document/_mtermvectors
{
    "ids" : ["1.xml"],
    "parameters": {
        "fields": [
                "content"
        ],
        "term_statistics": true
    }
}

你知道我做错了什么吗?谢谢你的帮助!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-09-13 03:49:44

您正在删除在这里摄取处理器中的content字段

代码语言:javascript
复制
.Remove<Document>(r => r
  .Field(f => f.Content)
)

这可能是您想要的,因为它将包含base64编码的附件。我认为API调用应该查看attachment.content字段,它将包含从附件中提取的内容。

代码语言:javascript
复制
POST /documents/document/_mtermvectors
{
    "ids" : ["1.xml"],
    "parameters": {
        "fields": [
            "attachment.content"
        ],
        "term_statistics": true
    }
}
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46186121

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档