遗憾的是,我不能完全理解多项式朴素贝叶斯模型中文档概率公式中的片段之一的含义。这是关于论文A Comparison of Event Models for Naive Bayes Text Classication,公式#5:

有问题的片段是P(|d_i|) -我不能完全理解,这个概率是什么意思?这是不是简单的第i个文档的概率?如果是,为什么会包含|...|操作?
发布于 2013-01-04 07:30:15
|d_i|是第i个文档中的字数。P(|d_i|)术语是生成恰好包含|d_i|单词的文档的概率。
https://stackoverflow.com/questions/14148516
复制相似问题