我正在寻找一个多项式朴素贝叶斯分类器,用C/C++编写,与OpenCV一起使用。
我正在寻找算法(或现成的实现),因为它将更有帮助,因为我正在试图了解它是如何工作的?
发布于 2012-08-08 04:07:01
朴素贝叶斯分类器是一种著名的分类算法.特别是在文本分类领域,所以我会把它作为解释。
假设我们有一些培训文档{d1 , d2 , d3 , ... , dm},其中每个文档可以用单词集合{w1,w2,w3, ... , wn}表示,并且每个文档都属于某种预定义的类集(这里以二进制案例(c_0,c_1)为例),我们的任务是将一些新的输入文档d分类为类c_0或类c_1。
一种直观的方法是采用最大似然估计:也就是说,
output c_0 if P(d | c_0) > P(d | c_1) and vice versa.因此,根据d的定义,我们可以用
P(d | c_0) = P( {w1,w2,w3...,wn} | c_0)由于计算这个联合概率,给定的类是如此复杂。因此,我们有一个强烈的假设,即单词是相互独立的,取决于课堂。所以这导致了我们
P(d | c_0) = P({w1,w2,w3...,wn} | c_0) = P(w1|c_0)*P(w2|c_0)*P(w2|c_0)...*P(wn|c_0)其中,每个P(w | c)都可以很容易地计算为c类中单词w的频率计数。
这个强烈的假设是“朴素”这个名字的原因,因为我们只是天真地为每个单词做级数乘法。
最后,采用answer = argmax P(d | c_0) , P(d | c_1)将结束该算法
我想在您的领域中,您所看到的是类似于文本分类,除了您需要提取的功能是不同的。
https://stackoverflow.com/questions/10889382
复制相似问题