首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从NCBI网页中提取特定的Fasta数据

从NCBI网页中提取特定的Fasta数据
EN

Stack Overflow用户
提问于 2021-01-13 15:39:42
回答 1查看 353关注 0票数 0
  1. I试图只提取"NM_213035.1“的fasta格式,输出除fasta之外的所有页面。
  2. fasta的检查部分存在于

中。

守则:

代码语言:javascript
复制
import bs4
import sys
from bs4 import BeautifulSoup
import requests

url = requests.get("https://www.ncbi.nlm.nih.gov/nuccore/{FASTA}?report=fasta".format(FASTA="NM_213035.1"))
url.raise_for_status()
ncbi = bs4.BeautifulSoup(url.text, "html.parser")

filename = ncbi.title.text
with open(filename, 'w+') as f:
    for i in ncbi.select('p'):
        f.write(i.getText())

产出:

警告: NCBI网站需要JavaScript才能运行。更多...下载features.Download基因features.NCBI参考序列: NM_213035.1

GenBank图形学

全序列

选定区域

发自:

至:

显示反向补码

显示空白功能,您的浏览活动是empty.Activity录音是关闭的。打开录音

美国国家医学图书馆国家生物技术信息中心

8600罗克维尔派克,贝塞斯达医学博士,20894美国

EN

回答 1

Stack Overflow用户

发布于 2021-01-19 11:48:58

您没有使用正确的URL通过REST获取FASTA文件。正如@Ghoti所指出的,正确的URL在这里描述:https://www.ncbi.nlm.nih.gov/books/NBK25497/

对于你来说,具体的问题是:

代码语言:javascript
复制
https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nuccore&id=NM_213035.1&rettype=fasta&retmode=text

如果您正在使用Python,您可以使用黑云母完成这项任务,这是我正在开发的一个包:https://www.biotite-python.org/apidoc/biotite.database.entrez.fetch.html

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65705108

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档