典型的文本分类,包括情感分析,可以采用以下两种方法之一: 1.有足够的训练数据时进行有监督的学习;2.当没有足够的训练数据时,进行无监督的训练。
我只有一个推特的集合,其中只包含文本(评论),没有极性冷杉每双湿。我的问题是,是否有任何方法对这些数据进行无监督学习的情感分析?
谢谢你帮我
发布于 2017-02-11 21:11:07
(基于你的评论,我把注意力集中在你问题的“无监督”部分,而忽略了深入学习。)
如果你使用像SentiWordNet这样的东西,你可以给推文中的每个单词分配一个肯定或消极的分数,然后(作为最简单的方法)把它们加起来,得到每个推文的一个情绪编号。
在这一点上,你做的是有监督的还是没有监督的学习并不重要,因为无论是哪种方式,你都会对每条推文都有一个分数,并且可以把它们划分为积极的、中立的和消极的情绪。有监督的数据,这个类,允许的是得到一个错误估计,它在分类方面做得有多好。
如果您想要在培训数据没有类的情况下进行错误估计,您可以自己评估某个百分比的tweet。即使只做30次,也会开始让你知道你的分组算法在哪里,从随机到完美,不会花很长时间。
https://stackoverflow.com/questions/42164082
复制相似问题