文章/答案/技术大牛

发布

社区首页 >问答首页 >使用TextBlob进行情感分析的Spark streaming

问使用TextBlob进行情感分析的Spark streaming
EN

Stack Overflow用户

提问于 2017-10-08 01:22:24

回答 1查看 1.2K关注 0票数 0

我是Spark的新手。开始我的第一个项目。需要分析twitter数据以进行情绪分析。为此，我需要使用Python语言中的TextBlob库。我能够获得twitter数据，并在所有必要的转换后创建Dstream。当TextBlob只接受字符串值时，我面临的挑战是如何使数据流数据(具有推文文本)可用于TextBlob进行分析。如何将数据流的值导入TextBlob进行情感分析。任何指针都是非常感谢的。

谢谢，Kary

nlp

apache-spark

twitter

回答 1

Stack Overflow用户

发布于 2018-11-28 00:15:43

我最近尝试使用Textblob进行流式数据集，并编写了一个小函数来将tweet转换为文本并应用textblob。所以你可以像这样写一些东西：

def getSentiment(self, text):
        sentiment = TextBlob(text).sentiment.polarity
         if sentiment > float(benchmark):
            return float(positive)
        elif sentiment < float(benchmark):
            return float(negative)
        else:
            return float(noresponse)

然后编写接受文本的UDF

sentiment_score_udf = F.udf(lambda x: obj.getSentiment(x), FloatType())

这里的F是pyspark sql函数，然后您可以使用beow来计算情感得分

sentiment_score_udf(col("value")).alias("sentiment_score")

希望这能有所帮助

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46623034

复制

相似问题

问使用TextBlob进行情感分析的Spark streaming
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用TextBlob进行情感分析的Spark streamingEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用TextBlob进行情感分析的Spark streaming
EN