文章/答案/技术大牛

发布

社区首页 >问答首页 >Python:朴素贝叶斯电影评论

问Python:朴素贝叶斯电影评论
EN

Stack Overflow用户

提问于 2016-11-06 21:31:02

回答 2查看 527关注 0票数 0

我的任务是将未见过的影评分为正面影评和负面影评。我有两个文件夹，neg和pos，每个文件夹包含1000个文件，这些文件是已经分类的电影评论。

到目前为止，我所做的是加载正面评论，并将每个单词以及每个单词出现的频率存储在字典中。然后，我将每个词频除以正文件夹文件中的总词数。我对负片文件夹也做了同样的事情。

我现在被困在了下一步该去哪里。最后，我将不得不加载一个看不见的评论，并确定评论是正面的还是负面的。我不寻找任何代码，只是指导我需要做下一步来实现这一点。任何帮助都非常感谢，谢谢！

python

probability

回答 2

Stack Overflow用户

发布于 2016-11-06 21:40:14

您正在描述的问题是一个典型的情感分析问题，您对评论所做的工作称为(word，probability)格式的语言模型。我建议你看丹·尤拉夫斯基教授关于情绪分析的视频系列，作为斯坦福大学关于自然语言处理here课程的一部分。Harrison Kinsley在NLTK上的另一个很好的实用tutorial，一个用于NLP相关任务的python模块，将向你展示如何使用NLTK和Scikit-学习一个流行的用于ML任务的python模块，使用NB分类器和其他许多分类。

票数 2

Stack Overflow用户

发布于 2016-11-06 22:24:46

这里最好的指导可能是Udacity ML课程……他们使用优秀的scikit-learn库来使用朴素贝叶斯对电子邮件进行分类，特别是NB的高斯特征；这听起来与您遇到的问题完全相同：

https://www.udacity.com/course/intro-to-machine-learning--ud120

如果您已经熟悉了这些概念，并且很乐意使用SK-learn，那么可以直接跳转到这里的文档：

http://scikit-learn.org/stable/modules/naive_bayes.html#multinomial-naive-bayes

一旦你有了正确形式的数据，用SK-learn拟合模型然后做出预测实际上是微不足道的。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40449877

复制

相似问题

问Python:朴素贝叶斯电影评论
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python:朴素贝叶斯电影评论EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python:朴素贝叶斯电影评论
EN