问R:站点抓取器的想法
EN

Stack Overflow用户

提问于 2012-01-13 03:20:34

回答 1查看 267关注 0票数 1

在这里度过一段艰难的时光。请导航到http://www.cbioportal.org/public-portal/index.do

它的底部写着：“从示例基因集合中选择”。如果你点击这些集合中的任何一个，基因列表就会出现在它的上方。我想提取列表中每一项的基因，但该列表不在源HTML中。

有什么想法吗？

谢谢!

javascript

html

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-01-13 04:14:58

该网页实际上使用了JSON来提取包含的数据，您可以使用rjson轻松地提取所有这些数据。这段代码将读取所有数据：

library(rjson)
json=fromJSON(file='http://www.cbioportal.org/public-portal/portal_meta_data.json')

user_genes = json$gene_sets[2:length(json$gene_sets)] # Remove first 'header' entry
df = data.frame(do.call(rbind,user_genes))
row.names(df) = NULL # Strip off ugly row names

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/8840994

复制

相似问题

问R:站点抓取器的想法
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R:站点抓取器的想法EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R:站点抓取器的想法
EN