我正在寻找一种java驱动的解决方案,用于分析句子以记录关键字是否被正面或负面使用。
例如,关键词可能是“卷心菜”,句子是:-
“我喜欢卷心菜,不喜欢豌豆。”
我想要一个某种java文本分析器来记录这是肯定的。可以利用lucene (Hibernate-Search)库来实现这一点吗?
有什么想法吗?
发布于 2010-09-23 20:57:31
你在寻找“情绪分析”。一种可能性是LingPipe,他好心地使用link to their competitors also。Jeff Dalton在his blog中也有一大堆自然语言处理工具。
发布于 2010-09-23 20:44:00
我怀疑有没有这样的东西。Lucene绝对不能开箱即用。
你如何以一种可以编程评估的方式来定义“关键字是被正面使用还是被负面使用”?为了正确地做到这一点,你必须分析文本的实际含义,这是一个甚至远未解决的人工智能问题。
我想你可以通过做一个统计分析来大致解决这个问题,即关键词出现的频率是更接近正面(比如,好,很好,很棒)还是负面(坏,讨厌,糟糕,该死),但即使是这样,否定,讽刺和复杂的句子结构也是有问题的。
发布于 2010-09-23 20:43:42
看看Mahout Taste,它构建在Lucene之上,但添加了许多您需要的开箱即用的东西。(编辑)我应该补充的是,Mahout Taste只是与你正在寻找的东西相关,而不是100%匹配。
https://stackoverflow.com/questions/3778388
复制相似问题