首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >为了检索打分,Elasticsearch 在索引时存储了哪些统计信息?

为了检索打分,Elasticsearch 在索引时存储了哪些统计信息?

作者头像
阿飞爱Coding
发布2025-12-05 17:44:55
发布2025-12-05 17:44:55
1640
举报
概述
Elasticsearch 的“智能打分”,本质是一套高效、可解释、工程友好的统计机制——而这一切,始于文档被索引的那一瞬间。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 🔍 一、BM25 打分需要哪些输入?
  • 💾 二、索引时存储的关键统计信息
    • 1. 词频(Term Frequency, f) → 存入倒排列表(Postings List)
    • 2. 文档长度(Document Length, |d|) → 存入 Norms
    • 3. 文档频率(Document Frequency, n_t) → 存入 Term Dictionary
    • 4. 全局统计量(N, \text{avgdl}) → 存入 Segment Metadata
  • 🗃️ 三、整体存储结构(Lucene Segment 视角)
    • 查询时如何使用?
  • 🧪 四、实战验证:通过 ES API 查看这些统计信息
  • ✅ 五、总结:索引时存什么,决定了查询时能多快打分
  • 📌 最后一句话
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档