首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用TextBlob进行情感分析的Spark streaming

使用TextBlob进行情感分析的Spark streaming
EN

Stack Overflow用户
提问于 2017-10-08 01:22:24
回答 1查看 1.2K关注 0票数 0

我是Spark的新手。开始我的第一个项目。需要分析twitter数据以进行情绪分析。为此,我需要使用Python语言中的TextBlob库。我能够获得twitter数据,并在所有必要的转换后创建Dstream。当TextBlob只接受字符串值时,我面临的挑战是如何使数据流数据(具有推文文本)可用于TextBlob进行分析。如何将数据流的值导入TextBlob进行情感分析。任何指针都是非常感谢的。

谢谢,Kary

EN

回答 1

Stack Overflow用户

发布于 2018-11-28 00:15:43

我最近尝试使用Textblob进行流式数据集,并编写了一个小函数来将tweet转换为文本并应用textblob。所以你可以像这样写一些东西:

代码语言:javascript
复制
def getSentiment(self, text):
        sentiment = TextBlob(text).sentiment.polarity
         if sentiment > float(benchmark):
            return float(positive)
        elif sentiment < float(benchmark):
            return float(negative)
        else:
            return float(noresponse)

然后编写接受文本的UDF

代码语言:javascript
复制
sentiment_score_udf = F.udf(lambda x: obj.getSentiment(x), FloatType())

这里的F是pyspark sql函数,然后您可以使用beow来计算情感得分

代码语言:javascript
复制
sentiment_score_udf(col("value")).alias("sentiment_score")

希望这能有所帮助

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46623034

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档