首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于NLTK的语义情感分类

基于NLTK的语义情感分类
EN

Stack Overflow用户
提问于 2015-07-05 12:56:50
回答 2查看 133关注 0票数 0

我正在尝试构建一个基于语义方法的反馈情绪分析器。举个例子:“我有一个安全的旅程”--假设这是一个司机的反馈,由一个乘客提供。我需要从这句话中提取以下信息:

代码语言:javascript
复制
"I had safe journey" -> 
 SUBJECT= "driving"
 SENTIMENT= "positive"

我正在使用NLTK,我参考了NLTK书。我已经阅读了“从文本中提取信息”一节。该部分讨论了使用基于正则表达式的语法的Chunking。但是我很困惑,英语有许多不同的句型,我不知道如何涵盖所有的可能性。

实际上,我是NLP的新手。我还在NLTK的书中找到了“分析句子结构”和“分析句子的意义”。分块足够实现我的目标了吗?我应该怎么做?

EN

回答 2

Stack Overflow用户

发布于 2015-07-05 16:08:51

你不一定要做解析或分块。主题的检测和情感极性的检测都可以在足够的质量水平下使用基于简单词袋的分级器来实现。这取决于输入文本的性质(它们有多长,有多少拼写/语法错误,有多少不同的主题...)以及您的需求(例如,如果你已经对80%的准确率感到满意)。

然而,你最需要的是一个已经分类的实例的训练集,或者一个好的极性词典。如果你两者都没有,解析/分块不会对你有多大帮助。

票数 0
EN

Stack Overflow用户

发布于 2015-07-05 19:01:41

两种解决方案:

  • Supervised学习:a Naive Bayes classifier将是合适的。它是有效的,但你需要一种训练set.
  • Lexicon-based方法:如果你没有训练集,你可以使用一个两极分化的单词列表。你应该对SentiWordNetMPQASentiStrength做一些研究。(额外的好处:你也可以看看WordNet-Affect,它提供了一棵情感树。它很旧了,但是你仍然可以在WNAffect interface)

中使用它

但首先,您应该对文本进行标记化。使用NLTK,您可以使用Punkt调用nltk.word_tokenize()

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31227281

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档