首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >文本挖掘基本问题

文本挖掘基本问题
EN

Stack Overflow用户
提问于 2016-04-06 07:34:30
回答 1查看 155关注 0票数 1

文本挖掘特定问题:

  1. 我来自汽车行业的CRM领域,在那里我们有很多非结构化的调查数据。第一个问题是-是否有一个特定领域的字典,可以在这里用来映射积极和消极的词,用于情感分析?如果是,请帮助我。
  2. 在进行情绪分析时,我们如何处理“不坏”和“不好”这样的词。不坏本质上意味着好,但会给出一个负面分数..。
  3. 我们如何处理那些位于重要词汇附近的词语。例如:“是没有帮助的”和“非常有帮助的”应该给予消极和积极的分数,因为这里重要的是“不”和“非常”,它围绕着“有用”这个词。有些人称这种方法为“意见挖掘”。它是如何发生在研发和照顾这样的情况。

任何人的帮助都将是非常感谢的。

EN

回答 1

Stack Overflow用户

发布于 2017-06-25 10:47:09

  1. 有好的和坏的关键字的基于上下文的语料库可能很少,但并不是为所有的数据集量身定做的。在某些情况下,结果可能会非常令人失望。对于这类问题,我建议你走机器学习的道路。有许多分类技术,你可以应用,我建议你尝试朴素贝叶斯,支持向量机,如果你有时间做基于文本的CNN (有点棘手,但非常准确)。再次,所有上述模型将严重依赖于您的培训语料库。其中的一个例子是可用的这里

2& 3.试着建立一个依赖树,斯坦福解析器在句子语法分析方面做得很好。例如,当我尝试用

“我不喜欢自助餐,相反,我会选择非常经济的阿拉卡提特。”

从上面的输出我们可以得到,情感词'like‘被否定的'not’修改。此外,“经济”一词由副词“甚”限定。有50多个关系,你只需担心4或5的情绪分析。这个链接将有助于解释这些关系是什么。您可以使用斯坦福解析器并使用它们的API。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36444385

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档