我试过的每一件事似乎都不管用。目前运行版本4.1.3的R,尝试重新安装easyPubMed软件包,但似乎没有任何工作。下面是我到目前为止掌握的代码:
new_query <- "(APE1[TI] OR OGG1[TI]) AND (2012[PDAT]:2016[PDAT])"
out.A <- batch_pubmed_download(pubmed_query_string = new_query,dest_file_prefix = "easyPM_example", batch_size = 150, encoding = "UTF-8")
cat(readLines(out.A[1])[1:32], sep = "\n")出于某种原因,它返回所有收集的xml样式文本的一行,后面是31行NA。
我还研究过使用fetching_pubmed_data()来达到类似的目的,但是每当我检查我所拥有的类时,我就会得到角色,而它应该是XMLInternalDocument和XMLAbstractDocument。这是我的密码:
my_query <- '"genetic therapy"[MeSH Terms]'
my_entrez_id <- get_pubmed_ids(my_query)
my_abstracts_xml <- fetch_pubmed_data(my_entrez_id)
class(my_abstracts_xml)任何帮助都是非常,非常感谢的!
发布于 2022-07-08 10:09:19
问题在于您的readLines调用;batch_pubmed_download和fetch_pubmed_data都像预期的那样工作。
在您的batch_pubmed_download示例中,下载的文件是带有三行文本的XML文件(可以使用readLines进行确认,也可以在带有wc -l的终端中确认)。因此,readLines(out.A[1])[1:32]没有任何意义,因为只有3行存在,所有其他索引都会导致NA。
https://stackoverflow.com/questions/72907862
复制相似问题