我想使用R中的twitteR包来比较11/14/2012-11/22/2012年11/14-11/22/2012(即8天时间段)两个竞争标签的提及次数(计数)。例如,我想每小时比较两个标签:#A和#B。
我想知道是否有一种方法可以在R中使用twitteR包来做到这一点。使用searchTwitter函数:
searchTwitter(searchString, n=25, lang=NULL, since=NULL, until=NULL,
locale=NULL, geocode=NULL, sinceID=NULL, ...)我对抓取所有的tweet不感兴趣,只是在指定的时间段内获得#A与#B的每小时计数比较。我知道我必须意识到速率限制,并且可能不得不对tweet进行一些巧妙的采样,以避免速率限制。如果这是可行的,有什么想法吗?我该如何编码呢?
发布于 2012-12-08 22:39:46
我会为每个hash标签每2分钟拉取100条tweet。使用#TweetsReturned / (TimePulled - TimeOfOldestTweet)获得每单位时间的推文估计值。您可以绘制这些图表,以获得一段时间内活动的移动平均类型的图表。如果你每2分钟发一次tweet,只要把它们加起来就可以估计每小时的tweet数。
https://stackoverflow.com/questions/13523627
复制相似问题