我目前从事资本市场建模工作。我使用Impala存储各种数据来源的数据,即金融新闻。
我使用Impala将这些数据存储在表单articleID,ArticleDATA的表中。
我的下一步是逐行对所有记录进行语义分析.
我一直在阅读这些资源
Executing and testing stanford core nlp example
http://nlp.stanford.edu/software/corenlp.shtml
http://nlp.stanford.edu/sentiment/code.html
我正在使用Java在Eclipse中创建Map/Reduce作业,但我想不出如何使用JAR来帮助我进行分析。
P.S:我在示例数据上运行了命令java -cp "*" -mx1g edu.stanford.nlp.sentiment.SentimentPipeline -file input.txt,它可以通过命令行运行。我想知道如何在eclipse中完成它,映射/减少。
目前的产出情绪是正的,中性的,负的,但我需要它为1,0,-1。我想这很容易搞清楚,所以这里没有优先考虑。
我不知道该怎么做。
谢谢
发布于 2014-04-25 18:04:29
我想出来了..。所以结束这个问题。必须处理罐子里的情感文件。反复试验。然后做了一个MApReduce工作。
https://stackoverflow.com/questions/23234886
复制相似问题