TF-IDF文档排序与二元独立排序模型有何不同?我无法区分它们。
我认为二进制独立模型的实际实现导致了TF-IDF。如果我错了,请帮帮我。
发布于 2017-02-04 18:20:50
主要的区别是,在二进制独立模型中,不知道一个单词有多重要,所有的单词都被同等对待。但是,使用TF-IDF加权单词会给在一个文档中使用较多且文档频率较低的单词更好的分数。
发布于 2017-02-03 06:27:36
你是对的。Binary Independence Model假设文档是二进制向量。也就是说,只记录文档中术语的存在或不存在。另一方面,根据Vector Space Model的说法,文档由术语权重的向量表示,TF-IDF只是表示术语权重的一种方式。
https://stackoverflow.com/questions/41995089
复制相似问题