首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >文章对象的情感分析

文章对象的情感分析
EN

Data Science用户
提问于 2020-09-05 09:07:51
回答 2查看 85关注 0票数 2

我的目标是:我有一篇大文章,我想定义这个词的情感。例如,这篇文章描述了自行车和汽车的利弊,我想找到“汽车”这个词的情感。

在这样的例子中,我不能使用文档级SA,因为文章本身可以是肯定的,而car则是负面的。

因此,我研究了与基于方面的情感分析相关的论文,但我的结论是缺乏培训NNs的数据。因此,我把重点放在基本上不涉及培训过程的方法上。我的目标之一是使用word2vec和K-Means构建情感分析工具,以便每个集群对应三种情绪(pos、neg和neu)中的一种。它确实很好,但我发现,出于某种原因,一个词可以同时出现在两个集群中。另外,它通常不会给出特定关键字的情感,而是针对文本中的所有方面。

另一个问题是,如果不自行读取文本并检查关键字是否属于正确的集群,则基本上无法测试输出的正确性。

因此,我决定先对文章进行总结,然后应用情感分析(如多愁善感或类似的)。

问题1

是否有改进word2vec+KMeans方法的方法?更上一层楼了吗?

问题2

在情感分析之前进行文本总结是个好主意吗?

问题2

是否有更好的方法可以在没有训练过程的情况下找到特定单词的情感(因为没有训练数据和少量未标注的数据)?

EN

回答 2

Data Science用户

回答已采纳

发布于 2020-09-06 14:46:16

我不确定我是否完全理解这个观点,但在我看来,你真正感兴趣的是一个词在特定语境中的情感:像"car“这样的内容词本身可能不具有稳定的情感,但它在特定的上下文中的使用可能会。

所以我建议这样一种方法:对于任何目标词,你都可以提取句子或上下文窗口,即左边的N个单词和目标单词的右边的N个单词。然后,您可以使用预定义的情感分析工具来提取此实例的情感值。从那里你可以:

  • 用实例的平均值来衡量一个词的平均情绪
  • 比较两个不同单词的情绪分布或平均情绪分布
票数 0
EN

Data Science用户

发布于 2020-09-15 15:56:50

我不知道你到底在问什么,所以如果你想在整个文本中确定汽车的整体情绪,你必须首先处理“回指决议”,因为你将遇到的第一个障碍是如何知道“它,它,她……”。指的是,也许是那辆车,也许是别的什么。另一种解决这个问题的方法是“如果是这样的话”,如果你的文档很小,你可以手动提取提到汽车的句子。

在此之后,您可以使用一个名为Vader "https://towardsdatascience.com/sentimental-analysis-using-vader-a3415fef7664“的NLTK模块进行情感分析,您只需一个接一个地给它句子,或者如果您希望将总分组合在一起并点击RUN :)

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/81263

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档