首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python:朴素贝叶斯电影评论

Python:朴素贝叶斯电影评论
EN

Stack Overflow用户
提问于 2016-11-06 21:31:02
回答 2查看 527关注 0票数 0

我的任务是将未见过的影评分为正面影评和负面影评。我有两个文件夹,neg和pos,每个文件夹包含1000个文件,这些文件是已经分类的电影评论。

到目前为止,我所做的是加载正面评论,并将每个单词以及每个单词出现的频率存储在字典中。然后,我将每个词频除以正文件夹文件中的总词数。我对负片文件夹也做了同样的事情。

我现在被困在了下一步该去哪里。最后,我将不得不加载一个看不见的评论,并确定评论是正面的还是负面的。我不寻找任何代码,只是指导我需要做下一步来实现这一点。任何帮助都非常感谢,谢谢!

EN

回答 2

Stack Overflow用户

发布于 2016-11-06 21:40:14

您正在描述的问题是一个典型的情感分析问题,您对评论所做的工作称为(word,probability)格式的语言模型。我建议你看丹·尤拉夫斯基教授关于情绪分析的视频系列,作为斯坦福大学关于自然语言处理here课程的一部分。Harrison Kinsley在NLTK上的另一个很好的实用tutorial,一个用于NLP相关任务的python模块,将向你展示如何使用NLTK和Scikit-学习一个流行的用于ML任务的python模块,使用NB分类器和其他许多分类。

票数 2
EN

Stack Overflow用户

发布于 2016-11-06 22:24:46

这里最好的指导可能是Udacity ML课程……他们使用优秀的scikit-learn库来使用朴素贝叶斯对电子邮件进行分类,特别是NB的高斯特征;这听起来与您遇到的问题完全相同:

https://www.udacity.com/course/intro-to-machine-learning--ud120

如果您已经熟悉了这些概念,并且很乐意使用SK-learn,那么可以直接跳转到这里的文档:

http://scikit-learn.org/stable/modules/naive_bayes.html#multinomial-naive-bayes

一旦你有了正确形式的数据,用SK-learn拟合模型然后做出预测实际上是微不足道的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40449877

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档