问信息检索系统
EN

Stack Overflow用户

提问于 2017-02-02 13:51:59

回答 2查看 191关注 0票数 1

TF-IDF文档排序与二元独立排序模型有何不同？我无法区分它们。

我认为二进制独立模型的实际实现导致了TF-IDF。如果我错了，请帮帮我。

回答已采纳

发布于 2017-02-04 18:20:50

主要的区别是，在二进制独立模型中，不知道一个单词有多重要，所有的单词都被同等对待。但是，使用TF-IDF加权单词会给在一个文档中使用较多且文档频率较低的单词更好的分数。

票数 2

发布于 2017-02-03 06:27:36

你是对的。Binary Independence Model假设文档是二进制向量。也就是说，只记录文档中术语的存在或不存在。另一方面，根据Vector Space Model的说法，文档由术语权重的向量表示，TF-IDF只是表示术语权重的一种方式。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/41995089

复制

相似问题

问信息检索系统EN