我想找出以下概率:
P(y=1/n=k; thetha) 读作:
概率,预测为1级,给定单词数= k,由thetha参数表示
传统的分类没有条件概率(对)
P(y = 1; thetha) 我该怎么解决这个问题?
编辑:
例如,假设我想根据附件的数量预测一封邮件是否是垃圾邮件。让y=1表明垃圾邮件和y=0是非垃圾邮件。
所以,
P(y = 1/num_attachements=0; some attributes)
and so on!!这有什么意义吗?
发布于 2012-02-24 00:07:32
通常,附件的数量只是另一个属性,所以您的概率与
P(y = 1 | all attributes)但是,如果您对附件有一些特殊的处理(例如,其他属性是数字的,附件是布尔的),则可以单独计算它们,然后将它们合并为:
P(C|A, B) = P(C|A) * P(C|B) / P(C)其中C代表事件y = 1,A -代表附件,B代表其他属性。
有关几个Nave Bayes分类器的说明,请参见本论文。
发布于 2012-02-23 23:46:03
使用朴素的Baisean分类器。您可以自己非常快地编写代码,或者使用/查看nltk库。
https://stackoverflow.com/questions/9423129
复制相似问题