在这里度过一段艰难的时光。请导航到http://www.cbioportal.org/public-portal/index.do
它的底部写着:“从示例基因集合中选择”。如果你点击这些集合中的任何一个,基因列表就会出现在它的上方。我想提取列表中每一项的基因,但该列表不在源HTML中。
有什么想法吗?
谢谢!
发布于 2012-01-13 04:14:58
该网页实际上使用了JSON来提取包含的数据,您可以使用rjson轻松地提取所有这些数据。这段代码将读取所有数据:
library(rjson)
json=fromJSON(file='http://www.cbioportal.org/public-portal/portal_meta_data.json')
user_genes = json$gene_sets[2:length(json$gene_sets)] # Remove first 'header' entry
df = data.frame(do.call(rbind,user_genes))
row.names(df) = NULL # Strip off ugly row nameshttps://stackoverflow.com/questions/8840994
复制相似问题