当我在一个项目上工作时,我需要下载和处理PubMed摘要的全文文章,是否有任何实现的代码或工具,允许用户输入一组PubMed ids并下载相同的免费全文文章。我们非常感谢任何形式的帮助或提示。
发布于 2011-01-15 16:30:03
由于PubMed的性质,我认为这在一般情况下是不可能的。您要做的最好的事情是从PubMedCentral的开放访问子集获取文章。PubMedCentral有一个number of online utilities来做这项工作。
发布于 2012-01-11 04:53:13
StompChicken所指的实用程序是供发布者在提交给PMC之前验证他们的XML的,它们不是用于下载的工具。
请注意,PMC中的绝大多数文章都不是开放获取(OA),因此无法通过任何方式自动(合法)下载。NCBI警告:
下载PMC内容的最好方法是使用PMC Open Access FTP服务:http://www.ncbi.nlm.nih.gov/pmc/tools/ftp/
您还可以使用eutils来查询项目管理中心并下载OA子集的全文以及其余部分的摘要:http://eutils.ncbi.nlm.nih.gov/corehtml/query/static/efetchlit_help.html
另一种选择是使用OAI服务:http://www.ncbi.nlm.nih.gov/pmc/tools/oai/
OAI服务的文档非常糟糕,但这里提供了一些入门技巧:http://www.biostars.org/p/2076/#13338
如果您希望维护和更新PMC存储库,请尝试使用pubtools:http://code.google.com/p/pubtools/
https://stackoverflow.com/questions/4693226
复制相似问题