我陷入了情绪分析,我找到了维达的解决方案,这是迄今为止我能找到的最好的方案。我的问题是,我找不到任何关于如何用英语以外的语言输入它的文档。
发布于 2017-08-04 01:26:26
简短的回答是“不”。
github页面上的自述文件声明
如果您可以访问互联网,该演示有一个示例,说明维达如何使用其他语言(非英语文本句子)分析文本的情感。
但是,如果您查看一下此演示的实际操作(从current version of vaderSentiment.py中的第552行开始),就会发现这完全基于使用机器翻译web服务将文本自动翻译成英语。因此,结果不仅取决于情感分析工具的准确性,还取决于您用来创建输入的英语版本的任何翻译工具的准确性。
Vader只对英文文本执行情感分析,但解决方法(自动翻译)可能是一个可行的选择。情感分析对常见的机器翻译问题没有其他用法那么敏感*,但如果你选择使用这种变通方法,你肯定仍然必须牢记这些限制。
*举个例子,演示中使用的服务翻译为"Das Internet funktioniert heute nicht. Ist eine Störung bekannt?“更准确地说,应该是“互联网今天不工作了,是已知的干扰吗?”。它在第一句话中把时态弄错了,虽然在这种情况下"Störung“有几个合法的翻译,但”混乱“充其量也是一个尴尬的选择。然而,虽然这使得它在总体上是一个相当糟糕的翻译,但这些错误不太可能对情绪分析产生重大影响。
发布于 2019-08-29 21:15:06
我尝试了另一种语言的NLTK Vader。它在德语中工作得相当好--毕竟,这两种语言彼此之间并不太远。
这涉及到一些工作--我们不能仅仅翻译词典:
更改代码中的vader_lexicon.txt
一般来说,否定是有效的,但有些情况下涉及一些额外的工作,我还没有弄清楚。
https://stackoverflow.com/questions/45275166
复制相似问题