我正在使用谷歌云在Twitter上做情绪分析。在我的bigtable中,我收到了成千上万人的推文。我想从推文中删除@NarendraModi。你能帮我找一个大查询吗?例如@NarendraModi祝贺先生在上面的推文中,我想从字符串中删除@narendramodi。@Narendramodi后面有一个空格
发布于 2019-05-27 01:20:48
下面是使用REPLACE或REGEXP_REPLACE的BigQuery标准SQL示例
#standardSQL
WITH `project.dataset.table` AS (
SELECT '@NarendraModi congratulation sir' tweet
)
SELECT REPLACE(tweet, '@NarendraModi ', ''),
REGEXP_REPLACE(tweet, r'@NarendraModi\s*', ''),
REGEXP_REPLACE(tweet, r'@\w+\s+', '')
FROM `project.dataset.table` 输出为
Row f0_ f1_ f2_
1 congratulation sir congratulation sir congratulation sir 我还剩下两个模式: 1)“@
:”和2)“@somename”。
下面介绍了其他模式
#standardSQL
WITH `project.dataset.table` AS (
SELECT '@NarendraModi congratulation sir' tweet UNION ALL
SELECT '@NarendraModi. congratulation sir' tweet UNION ALL
SELECT '@NarendraModi: congratulation sir' tweet
)
SELECT REGEXP_REPLACE(tweet, r'@\w+[:.\s]*', '')
FROM `project.dataset.table` 有结果
Row f0_
1 congratulation sir
2 congratulation sir
3 congratulation sir https://stackoverflow.com/questions/56315718
复制相似问题