我想用scikit和nltk对股票评论进行情绪分析。我已经对不同的股票发表了大约100条评论,比如我标记为正面(1)或“这是注定的股票”(0)的“这个股票将摇滚乐”。因此,我想训练分类器,它可以判断我添加的新注释是负面的还是正面的。所以我的问题是怎么做。我已经在网上搜索过了,但我发现的只是电影评论、情绪分析,这与主题相当遥远。
发布于 2018-10-12 20:01:09
您现在所做的是使用分类的传统监督学习。这是一个很好的预测结果的方法,但是我怀疑有更好的方法来完成你正在做的这个情绪分析项目。
在不知道分析的目标是什么的情况下,我建议您查看NLTK包。我们已经做了很多工作来证明一个词的集合是积极还是消极的,你可以依靠一些非常聪明的人的工作。
如果您在启动过程中遇到困难,可以查看NLTK的入门教程、一些Kaggle内核或在线查找一些文章。
祝好运!
https://datascience.stackexchange.com/questions/39573
复制相似问题