我对从不同的reddit subreddits获取数据感兴趣。有没有人知道有没有类似twitter的reddit/其他api来抓取所有的页面?
发布于 2013-01-15 01:56:58
是的,reddit有一个API,可以用于各种目的,比如数据收集,自动评论机器人,甚至辅助subreddit审核。
在reddit的API上有几个地方可以找到信息:
的问题
如果您已经熟悉了一种特定的编程语言,那么您应该查看各种语言的existing set of API wrappers。尽管我有偏见(我是包的维护者),但我非常确定,对于python,PRAW支持最多的reddit API特性。
发布于 2017-06-27 06:02:01
请注意,如果您只是在阅读数据,而对发回reddit不感兴趣,那么您可以从与每个子reddit相关联的json提要中获取大量数据。使用这种方法,您根本不需要担心API --您只需请求相关的json文件,并用您选择的语言解析它。
下面是一个示例URL,它将返回一个json对象,其中包含从Justrolledintotheshop子subreddit:https://www.reddit.com/r/Justrolledintotheshop/top.json到的热门帖子
您可以使用hot、new或controversial代替top。使用top时,您可以将?t=day添加到url的末尾,以指定当天的热门帖子。其他有效值为hour、day、week、month、year或all。
发布于 2018-02-20 19:14:17
用ajax/javascript.解析reddit中的JSON数据
Reddit为GET请求启用了CORS。
以下为示例,解析来自reddit的最后一段JSON格式的视频:
xhr = new XMLHttpRequest
xhr.open("GET","https://www.reddit.com/r/videos/.json",true)
xhr.send(null)
xhr.onreadystatechange = function() {
if(this.status === 200) {
console.log(JSON.parse(xhr.responseText))
}
}
https://developer.mozilla.org/fr/docs/Web/API/XMLHttpRequest
要更深入地了解,请查看这个问题:
https://stackoverflow.com/questions/14322834
复制相似问题