我想用最大熵模型来实现我自己的情感分析。不用任何阿皮。最大熵模型的最佳特征f(c,d)是什么?我有三类--正面、负面和中性。
发布于 2015-10-19 14:39:36
情感分析中最常用和最有效的一些特性是单字。Bigrams也可以使用,但是对于它们是否真的有用是很有争议的。
请注意,使用单字/双格的频率值并不能显著改善情感分析的结果;因此,提取单词类型并使用布尔值来表示文本中它们的存在/缺失通常就足够了。
重要的是在提取这些特性之前如何对文本进行预处理。例如,除了较低的大写标记外,处理否定范围可以提高提取unigram特征时的结果。
无论如何,情感分析是一个广泛的领域。您会发现不同的特征提取策略会根据您需要执行的特定类型的分析(例如基于特征的分析、主观性分析、极性分析等)而产生不同的结果。
你几乎可以在这里找到所有你需要开始的东西:
https://stackoverflow.com/questions/33185951
复制相似问题