我偶然发现了之前的一篇文章,它已经解决了,并对它进行了跟踪,但我无法发表评论,因为我的声誉不到50。本质上,我对在朴素贝叶斯中计算分母感兴趣。

现在,我了解到朴素贝叶斯中的特性是独立的,所以我们可以计算p(x) = p(x_{1})p(x_{2})...p(x_{n})吗?或者我们必须使用这个公式p(\mathbf{x}) = \sum_k p(C_k) \ p(\mathbf{x} \mid C_k),条件独立假设为p(\mathbf{x} \mid C_k) = \Pi_{i} \, p(x_i \mid C_k) 。
我的问题是,这两种计算方法都会给出相同的p(x)吗?
链接到原始问题:https://datascience.stackexchange.com/posts/69699/edi
编辑**:对不起,我认为这些功能有条件独立,而不是完全独立。因此,使用p(x) = p(x_{1})p(x_{2})...p(x_{n})是不正确的?
最后,我知道我们其实不需要分母来找出我们的概率,而是出于好奇。
发布于 2020-08-20 22:24:24
计算p(x)的方法确实是:
由于通常需要计算每个p(C_k,x) (分子)的k,所以它足够简单,可以将所有这些k值之和。确实,使用这种产品是不正确的。
最后,我知道我们其实不需要分母来找出我们的概率,而是出于好奇。
不需要计算边际p(x)才能找到最有可能的类C_k,因为:
然而,它实际上需要找到后验概率p(C_k | x),这就是为什么计算分母p(x)来获得p(C_k | x)通常是有用的,特别是如果要输出实际的概率。
https://datascience.stackexchange.com/questions/80593
复制相似问题