文章/答案/技术大牛

发布

社区首页 >问答首页 >Weka NaiveBayes分类器给出了不同(错？)均值/标准差-数值上的偏差

问Weka NaiveBayes分类器给出了不同(错？)均值/标准差-数值上的偏差
EN

Stack Overflow用户

提问于 2011-12-24 02:45:01

回答 1查看 2.2K关注 0票数 2

我尝试使用NaiveBayes分类器和NaiveBayesSimple分类器进行分类，使用以下数据：

@attribute a real
@attribute b {yes, no}                                                                                        

@data                                                                                                            
1,yes
3,yes
5,yes
2,yes
1,yes
4,no
7,no
5,no
8,no
9,no

当使用NaiveBayesSimple分类器时，我得到了预期的均值和方差值：

=== Classifier model (full training set) ===

Naive Bayes (simple)

Class yes: P(C) = 0.5       

Attribute a
Mean: 2.4           Standard Deviation: 1.67332005



Class no: P(C) = 0.5       

Attribute a
Mean: 6.6           Standard Deviation: 2.07364414

但是，在使用NaiveBayes分类器时，我得到了不同的值：

=== Classifier model (full training set) ===

Naive Bayes Classifier

            Class
Attribute         yes     no
                (0.5)  (0.5)
=============================
a
  mean          2.5143 6.6286
  std. dev.     1.3328 1.8286
  weight sum         5      5
  precision     1.1429 1.1429

我想知道转移的原因是什么？我已经读过一篇文章，说NaiveBayes分类器是基于：http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.8.3257的，因此看不到任何理由。

谢谢

machine-learning

classification

weka

回答 1

Stack Overflow用户

发布于 2012-05-10 18:04:57

这两种算法各不相同。

Weka中的朴素贝叶斯定义如下：

名称weka.classifiers.bayes.NaiveBayes

一个使用估计类的朴素贝叶斯分类器的概要类。在对训练数据进行分析的基础上，选择了数值估计精度值。因此，分类器不是UpdateableClassifier (通常使用零训练实例初始化) --如果需要UpdateableClassifier功能，请使用NaiveBayesUpdateable分类器。当调用具有零训练实例的NaiveBayesUpdateable时，buildClassifier分类器将对数值属性使用默认精度为0.1。

有关朴素贝叶斯分类器的更多信息，请参见

乔治·H·约翰，帕特·兰利:在贝叶斯分类器中估计连续分布。第十一次人工智能不确定性问题会议，圣马特奥，338-345,1995年。

选项调试--如果设置为true，分类器可能会将附加信息输出到控制台。

displayModelInOldFormat --模型输出使用旧格式。当有许多类值时，旧的格式会更好。当有较少的类和许多属性时，新的格式会更好。

useKernelEstimator -对数值属性使用内核估计器，而不是正态分布。

useSupervisedDiscretization --使用监督离散化将数字属性转换为标称属性。

NaiveBayesSimple的定义如下：

名称weka.classifiers.bayes.NaiveBayesSimple

用于构建和使用简单朴素贝叶斯classifier.Numeric属性的概要类是由正态分布建模的。

有关详细信息，请参阅

Richard Duda，Peter Hart (1973)。模式分类和场景分析。威利，纽约。

选项调试--如果设置为真，分类器可能会将附加信息输出到控制台.

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/8622341

复制

相似问题

问Weka NaiveBayes分类器给出了不同(错？)均值/标准差-数值上的偏差
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Weka NaiveBayes分类器给出了不同(错？)均值/标准差-数值上的偏差EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Weka NaiveBayes分类器给出了不同(错？)均值/标准差-数值上的偏差
EN