有谁知道将单核苷酸多态性(SNP) ID从rs#转换为SNP_A-#的方法吗?我有两个SNP,rs429358和rs4420638,需要确定这些SNP是否包含在不同的数据集中。数据集使用SNP_A-xxxxx符号作为SNP ID。任何帮助都将不胜感激!
发布于 2012-08-21 21:38:25
SNP_A###标识符很可能是Affymetrix SNP ids。您需要知道它们来自哪个阵列,但它可能是人类基因组范围的SNP6.0。
您可以从Affymetrix网站下载注释数据,该网站将提供rs#到affyid#的映射。尝试从:http://www.affymetrix.com/support/mas/index.affx#1_1开始
为Genomewide SNP 6.0阵列产品选择“软件和数据”下的“注释文件”。
一个问题是,阵列上的一些rsid#是冗余的-对于很小的子集,您将有多个affyid#映射到一个probesets
发布于 2012-08-21 07:09:50
你应该问一下生物之星:http://www.biostars.org/show/questions/
SNP_A###不是一个正式的术语。它是从哪里来的?
比较ID的唯一方法是比较染色体/位置/等位基因-ref/等位基因-alt。
发布于 2015-03-17 03:07:23
SNP_A*标识符是Affymetrix SNP ID。我也必须做一些类似的事情,但规模要大得多。在这里使用Affymetrix Annotation文件"Genomewide SNP6.0“并没有像我希望的那样映射:http://www.affymetrix.com/support/mas/index.affx#1_1
我所做的是使用Biopython (我用Python3做的)。首先,您必须通过pip安装biopython。
在此之后,您可以使用Entrez库来使用esearch()方法。下面是一些示例代码:
from Bio import Entrez
Entrez.email = '<email address>'
handle = Entrez.esearch(db='snp', retmax='1', sort='SNP_ID', term='<affymetrix id>')
results = Entrez.read(handle)
rsNumber = 'rs'+results['IdList'][0]这应该会给你一个来自affymetrix id的正确的rs编号。
https://stackoverflow.com/questions/12045319
复制相似问题