问Scikit分类比较/排名
EN

Stack Overflow用户

提问于 2015-04-22 10:48:31

回答 1查看 1.3K关注 0票数 1

我是刚接触scikit的人，我正在学习下面的例子

http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html#exercise-3-cli-text-classification-utility

然而，我想知道，如果我想要分类的字符串A和B都被归入来自朴素贝叶斯的同一文档组，我是否能够找到哪个字符串更有可能被归入文档组？

例如，如果文档组是'computer graphics‘，我有一个字符串"Computers are cool"，另一个字符串是"OpenGL和CUDA are cool"，虽然它们都可能被归入该文档组，但第二个字符串在该文档组下的分类可能更强，因为它的tf-idf分数可能更高。在我对它们进行分类之后，有没有办法找出它们，这样我就可以找出哪个字符串更能代表这个类别？

python

scikit-learn

classification

回答 1

Stack Overflow用户

发布于 2015-04-22 10:53:34

scikit中的许多分类器都有一个方法predict_proba，该方法返回给定测试数据落入任何可用输出类别的预测概率。(例如，Here就是用于高斯朴素贝叶斯的方法。)您可以使用它来计算模型对分类的置信度。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/29786845

复制

相似问题

问Scikit分类比较/排名
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Scikit分类比较/排名EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Scikit分类比较/排名
EN