首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R:站点抓取器的想法

R:站点抓取器的想法
EN

Stack Overflow用户
提问于 2012-01-13 03:20:34
回答 1查看 267关注 0票数 1

在这里度过一段艰难的时光。请导航到http://www.cbioportal.org/public-portal/index.do

它的底部写着:“从示例基因集合中选择”。如果你点击这些集合中的任何一个,基因列表就会出现在它的上方。我想提取列表中每一项的基因,但该列表不在源HTML中。

有什么想法吗?

谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-01-13 04:14:58

该网页实际上使用了JSON来提取包含的数据,您可以使用rjson轻松地提取所有这些数据。这段代码将读取所有数据:

代码语言:javascript
复制
library(rjson)
json=fromJSON(file='http://www.cbioportal.org/public-portal/portal_meta_data.json')

user_genes = json$gene_sets[2:length(json$gene_sets)] # Remove first 'header' entry
df = data.frame(do.call(rbind,user_genes))
row.names(df) = NULL # Strip off ugly row names
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8840994

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档