阿飞爱Coding
为了检索打分,Elasticsearch 在索引时存储了哪些统计信息?
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
阿飞爱Coding
社区首页
>
专栏
>
为了检索打分,Elasticsearch 在索引时存储了哪些统计信息?
为了检索打分,Elasticsearch 在索引时存储了哪些统计信息?
阿飞爱Coding
关注
发布于 2025-12-05 17:44:55
发布于 2025-12-05 17:44:55
164
0
举报
概述
Elasticsearch 的“智能打分”,本质是一套高效、可解释、工程友好的统计机制——而这一切,始于文档被索引的那一瞬间。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
elasticsearch
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
elasticsearch
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
🔍 一、BM25 打分需要哪些输入?
💾 二、索引时存储的关键统计信息
1. 词频(Term Frequency, f) → 存入倒排列表(Postings List)
2. 文档长度(Document Length, |d|) → 存入 Norms
3. 文档频率(Document Frequency, n_t) → 存入 Term Dictionary
4. 全局统计量(N, \text{avgdl}) → 存入 Segment Metadata
🗃️ 三、整体存储结构(Lucene Segment 视角)
查询时如何使用?
🧪 四、实战验证:通过 ES API 查看这些统计信息
✅ 五、总结:索引时存什么,决定了查询时能多快打分
📌 最后一句话
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐