首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >朴素贝叶斯分母澄清

朴素贝叶斯分母澄清
EN

Data Science用户
提问于 2020-08-20 19:31:38
回答 1查看 192关注 0票数 2

我偶然发现了之前的一篇文章,它已经解决了,并对它进行了跟踪,但我无法发表评论,因为我的声誉不到50。本质上,我对在朴素贝叶斯中计算分母感兴趣。

现在,我了解到朴素贝叶斯中的特性是独立的,所以我们可以计算p(x) = p(x_{1})p(x_{2})...p(x_{n})吗?或者我们必须使用这个公式p(\mathbf{x}) = \sum_k p(C_k) \ p(\mathbf{x} \mid C_k),条件独立假设为p(\mathbf{x} \mid C_k) = \Pi_{i} \, p(x_i \mid C_k)

我的问题是,这两种计算方法都会给出相同的p(x)吗?

链接到原始问题:https://datascience.stackexchange.com/posts/69699/edi

编辑**:对不起,我认为这些功能有条件独立,而不是完全独立。因此,使用p(x) = p(x_{1})p(x_{2})...p(x_{n})是不正确的?

最后,我知道我们其实不需要分母来找出我们的概率,而是出于好奇。

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-08-20 22:24:24

计算p(x)的方法确实是:

p(x) = \sum_k p(C_k) \ p(x| C_k)

由于通常需要计算每个p(C_k,x) (分子)的k,所以它足够简单,可以将所有这些k值之和。确实,使用这种产品是不正确的。

最后,我知道我们其实不需要分母来找出我们的概率,而是出于好奇。

不需要计算边际p(x)才能找到最有可能的类C_k,因为:

argmax_k(\{ p(C_k|x) \}) = argmax_k(\{ p(C_k,x) \})

然而,它实际上需要找到后验概率p(C_k | x),这就是为什么计算分母p(x)来获得p(C_k | x)通常是有用的,特别是如果要输出实际的概率。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/80593

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档