我正在使用R包rtweet来传输实时推文。
一切都很好,但我想要的是自动将信息存储在Google Big Query中,并将其显示在Data Studio中,并且该信息应该每X次更新一次(例如,5分钟)。
我该怎么做呢?问题是,当sreaming时,R会话很忙,所以我不能做其他任何事情。
我还会考虑将流停止一秒钟,以存储信息,并在……之后恢复。
下面是我的代码:
library(rtweet)
library(bigrquery)
token <- create_token(
app = "app name",
consumer_key = "consumer_key ",
consumer_secret = "consumer_secret ",
acess_token = "acess_token",
access_secret = "access_secret")
palabras <- ""
streamtime <- 2 * 60
rt <- stream_tweets(q = palabras, timeout = streamtime)
#This is what I want to do each X time to store the information in Big Query:
insert_upload_job("project id", "dataset name", "table name", df, write_disposition = "WRITE_APPEND")感谢所有人,
发布于 2019-07-04 12:40:26
我对R了解不多,但我遇到过类似的情况,在stream_tweets()运行期间,除了等待超时之外,没有什么可做的。
我不确定这是否可能,但是,stream_tweets()创建了一个JSON对象,该对象在函数运行时被填充。当新项目被添加到JSON存储到Big Query时,不能运行其他R脚本吗?比如,把你的代码一分为二,然后并行运行?
希望我的回答能给你一些启发。
https://stackoverflow.com/questions/51632296
复制相似问题