首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用PubMed包下载许多easyPubMed记录?

如何使用PubMed包下载许多easyPubMed记录?
EN

Stack Overflow用户
提问于 2022-07-08 07:07:43
回答 1查看 68关注 0票数 0

我试过的每一件事似乎都不管用。目前运行版本4.1.3的R,尝试重新安装easyPubMed软件包,但似乎没有任何工作。下面是我到目前为止掌握的代码:

代码语言:javascript
复制
new_query <- "(APE1[TI] OR OGG1[TI]) AND (2012[PDAT]:2016[PDAT])"
out.A <- batch_pubmed_download(pubmed_query_string = new_query,dest_file_prefix = "easyPM_example", batch_size = 150, encoding = "UTF-8")
cat(readLines(out.A[1])[1:32], sep = "\n")

出于某种原因,它返回所有收集的xml样式文本的一行,后面是31行NA。

我还研究过使用fetching_pubmed_data()来达到类似的目的,但是每当我检查我所拥有的类时,我就会得到角色,而它应该是XMLInternalDocument和XMLAbstractDocument。这是我的密码:

代码语言:javascript
复制
my_query <- '"genetic therapy"[MeSH Terms]'
my_entrez_id <- get_pubmed_ids(my_query)
my_abstracts_xml <- fetch_pubmed_data(my_entrez_id)
class(my_abstracts_xml)

任何帮助都是非常,非常感谢的!

EN

回答 1

Stack Overflow用户

发布于 2022-07-08 10:09:19

问题在于您的readLines调用;batch_pubmed_downloadfetch_pubmed_data都像预期的那样工作。

在您的batch_pubmed_download示例中,下载的文件是带有三行文本的XML文件(可以使用readLines进行确认,也可以在带有wc -l的终端中确认)。因此,readLines(out.A[1])[1:32]没有任何意义,因为只有3行存在,所有其他索引都会导致NA

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72907862

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档