文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么在本例中OpenCV3.1 NormalBayesClassifier的错误率如此之高？

问为什么在本例中OpenCV3.1 NormalBayesClassifier的错误率如此之高？
EN

Stack Overflow用户

提问于 2016-10-16 01:57:33

回答 1查看 327关注 0票数 2

我试图在一个简单的问题上使用OpenCV3.1的NormalBayesClassifier，我可以很容易地为这个问题生成培训数据。我决定把输入数字分类为偶数或奇数。显然，这可以以100%的精度直接计算，但关键是要练习OpenCV的ML功能，以便熟悉它。

所以，我的第一个问题是--为什么NormalBayesClassifier不是这个问题的合适模型，有什么理论原因吗？

如果不是，第二个问题是，为什么我的错误率这么高？cv::ml::StatModel::calcError()给了我30% - 70%的输出。

第三，降低错误率的最好方法是什么？

下面是一个最小的、独立的代码片段，它演示了这个问题：

(要明确的是，分类/输出应该是偶数的0，奇数的1 )。

#include <ml.h>
#include <iomanip>

int main() {

   const int numSamples = 1000;
   cv::RNG rng = cv::RNG::RNG((uint64) time(NULL));

   // construct training sample data

   cv::Mat samples;
   samples.create(numSamples, 1, CV_32FC1);

   for (int i = 0; i < numSamples; i++) {
      samples.at<float>(i) = (int)rng(10000);
   }

   // construct training response data

   cv::Mat responses;
   responses.create(numSamples, 1, CV_32SC1);

   for (int i = 0; i < numSamples; i++) {
      int sample = (int) samples.at<float>(i);
      int response = (sample % 2);
      responses.at<int>(i) = response;
   }

   cv::Ptr<cv::ml::TrainData> data = cv::ml::TrainData::create(samples, cv::ml::ROW_SAMPLE, responses);

   data->setTrainTestSplitRatio(.9);

   cv::Ptr<cv::ml::NormalBayesClassifier> classifier = cv::ml::NormalBayesClassifier::create();

   classifier->train(data);

   float errorRate = classifier->calcError(data, true, cv::noArray());

   std::cout << "Bayes error rate: [" << errorRate << "]" << std::endl;

   // construct prediction inputs
   const int numPredictions = 10;

   cv::Mat predictInputs;
   predictInputs.create(numPredictions, 1, CV_32FC1);

   for (int i = 0; i < numPredictions; i++) {
      predictInputs.at<float>(i) = (int)rng(10000);
   }

   cv::Mat predictOutputs;
   predictOutputs.create(numPredictions, 1, CV_32SC1);

   // run prediction

   classifier->predict(predictInputs, predictOutputs);

   int numCorrect = 0;

   for (int i = 0; i < numPredictions; i++) {
      int input = (int)predictInputs.at<float>(i);
      int output = predictOutputs.at<int>(i);
      bool correct = (input % 2 == output);

      if (correct)
         numCorrect++;

      std::cout << "Input = [" << (int)predictInputs.at<float>(i) << "], " << "predicted output = [" << predictOutputs.at<int>(i) << "], " << "correct = [" << (correct ? "yes" : "no") << "]"  << std::endl;
   }

   float percentCorrect = (float)numCorrect / numPredictions * 100.0f;

   std::cout << "Percent correct = [" << std::fixed << std::setprecision(0) << percentCorrect << "]" << std::endl;
}

样本运行输出：

Bayes error rate: [36]
Input = [9150], predicted output = [1], correct = [no]
Input = [3829], predicted output = [0], correct = [no]
Input = [4985], predicted output = [0], correct = [no]
Input = [8113], predicted output = [1], correct = [yes]
Input = [7175], predicted output = [0], correct = [no]
Input = [811], predicted output = [1], correct = [yes]
Input = [699], predicted output = [1], correct = [yes]
Input = [7955], predicted output = [1], correct = [yes]
Input = [8282], predicted output = [1], correct = [no]
Input = [1818], predicted output = [0], correct = [yes]
Percent correct = [50]

c++

opencv

machine-learning

naivebayes

opencv3.1

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-10-17 12:48:00

在您的代码中，您向算法提供了一个单独的特性，这是要分类的数字。这还不够，除非您多次提供几个相同数字的示例。如果你想让学习算法学习一些关于奇数和偶数的东西，你需要考虑分类器可以使用什么样的特征来学习。大多数机器学习技术首先需要仔细的特征工程。

既然您想试验ML，我建议如下：

对于每个数字，创建5个特征，一个编码每个数字。5为00005，f1=0、f2=0、f3=0、f4=0、f5=0和11098为f1=1、f2=2、f3=0、f4=9、f5=8。
如果你有更大的数字，你只能保留最后5位数字。
训练你的分类器
使用相同的编码进行测试。您希望从分类器中了解到，只有最后一个数字才是确定奇数和偶数的重要因素。

如果您想更多地使用它，可以用二进制格式对数字进行编码。这将使分类器更容易了解数字的奇数或偶数。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40066066

复制

相似问题

问为什么在本例中OpenCV3.1 NormalBayesClassifier的错误率如此之高？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么在本例中OpenCV3.1 NormalBayesClassifier的错误率如此之高？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么在本例中OpenCV3.1 NormalBayesClassifier的错误率如此之高？
EN