首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Big-查询tweets字符串中的remove @ImSRK

Big-查询tweets字符串中的remove @ImSRK
EN

Stack Overflow用户
提问于 2019-05-27 01:12:21
回答 1查看 57关注 0票数 0

我正在使用谷歌云在Twitter上做情绪分析。在我的bigtable中,我收到了成千上万人的推文。我想从推文中删除@NarendraModi。你能帮我找一个大查询吗?例如@NarendraModi祝贺先生在上面的推文中,我想从字符串中删除@narendramodi。@Narendramodi后面有一个空格

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-27 01:20:48

下面是使用REPLACE或REGEXP_REPLACE的BigQuery标准SQL示例

代码语言:javascript
复制
#standardSQL
WITH `project.dataset.table` AS (
  SELECT '@NarendraModi congratulation sir' tweet
)
SELECT REPLACE(tweet, '@NarendraModi ', ''),
  REGEXP_REPLACE(tweet, r'@NarendraModi\s*', ''),
  REGEXP_REPLACE(tweet, r'@\w+\s+', '')
FROM `project.dataset.table`   

输出为

代码语言:javascript
复制
Row f0_                 f1_                 f2_  
1   congratulation sir  congratulation sir  congratulation sir    

我还剩下两个模式: 1)“@

:”和2)“@somename”。

下面介绍了其他模式

代码语言:javascript
复制
#standardSQL
WITH `project.dataset.table` AS (
  SELECT '@NarendraModi congratulation sir' tweet UNION ALL
  SELECT '@NarendraModi. congratulation sir' tweet UNION ALL
  SELECT '@NarendraModi: congratulation sir' tweet 

)
SELECT REGEXP_REPLACE(tweet, r'@\w+[:.\s]*', '')
FROM `project.dataset.table`   

有结果

代码语言:javascript
复制
Row f0_  
1   congratulation sir   
2   congratulation sir   
3   congratulation sir   
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56315718

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档