首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >信息检索系统

信息检索系统
EN

Stack Overflow用户
提问于 2017-02-02 13:51:59
回答 2查看 191关注 0票数 1

TF-IDF文档排序与二元独立排序模型有何不同?我无法区分它们。

我认为二进制独立模型的实际实现导致了TF-IDF。如果我错了,请帮帮我。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-02-04 18:20:50

主要的区别是,在二进制独立模型中,不知道一个单词有多重要,所有的单词都被同等对待。但是,使用TF-IDF加权单词会给在一个文档中使用较多且文档频率较低的单词更好的分数。

票数 2
EN

Stack Overflow用户

发布于 2017-02-03 06:27:36

你是对的。Binary Independence Model假设文档是二进制向量。也就是说,只记录文档中术语的存在或不存在。另一方面,根据Vector Space Model的说法,文档由术语权重的向量表示,TF-IDF只是表示术语权重的一种方式。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41995089

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档