首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >绘制染色体上不同SNPs等位基因频率的好方法

绘制染色体上不同SNPs等位基因频率的好方法
EN

Stack Overflow用户
提问于 2016-08-17 04:20:04
回答 2查看 2.5K关注 0票数 1

我有一组来自基因组不同部分的SNPs,以及它们在不同群体和元群体中的等位基因频率。我想沿着SNPs的基因组坐标绘制所有22个常染色体的等位基因频率。

基本上,我想从Sankararaman等人那里生成如图1A所示的内容。(2014) (http://www.nature.com/nature/journal/v507/n7492/fig_tab/nature12961_F1.html)除了Y轴是频率外,所有的种群都在同一张图上(不是分开的),我会有彩色的点而不是尖峰。

我的数据的格式是这样的(MAF =次要等位基因频率,这就是我想要的图形)

代码语言:javascript
复制
CHR    SNP        COORD   CLST   A1   A2    MAF    MAC  NCHROBS
1   rs16823303  2903159  Region  G    A   0.01887   4     212

(它遍历on region的所有SNP,然后对下一个region执行SNP,以此类推)

关于如何在R中做到这一点有什么建议吗?谢谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-08-17 04:53:09

对于坐标与频率的简单关系图,下面是一个示例:

代码语言:javascript
复制
#Example data:
MAF=runif(1000,min=0,max=1)
COORD=runif(1000,min=0,max=100000)
test.df=data.frame(COORD,MAF)

#plot
plot(test.df$COORD,test.df$MAF)

在图中,您不需要示例数据,但需要将中的表名替换为test.df

如果你需要用颜色/标签等来美化它,你也可以这样做:

代码语言:javascript
复制
plot(test.df$COORD,test.df$MAF, col="red", pch=18)

代码语言:javascript
复制
library(ggplot2)
p=ggplot(test.df,aes(COORD,MAF))
p + geom_point()
票数 2
EN

Stack Overflow用户

发布于 2016-08-17 04:34:31

我认为这是非常普通的Q,而不是与Q相关的程序。我不确定是否有合适的资源来标记以获取答案(可能是谷歌基因组学,但更多的是为了解决你的代码问题)。不过,我可以给你指出一些你可以开始使用的网络资源。

http://ged.msu.edu/angus/tutorials-2011/allele_freq_plots_R.html

https://www.biostars.org/p/18954/

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4390227/

https://biodatamining.biomedcentral.com/articles/10.1186/1756-0381-6-18

你可以从这些开始,当你遇到障碍时,你可以粘贴你在SO中无法成功运行的代码。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38983769

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档