我想从50k+基因中获得一个包含该基因、该基因的GC含量和基因长度的表。
我听说我可以从UCSC基因组浏览器上得到这个,但我不知道如何...非常感谢您的帮助!
发布于 2015-06-18 06:20:34
为此,您可以使用awk脚本。确保每个基因的序列都在row.This中,这样就可以得到每行的GC含量。
awk '{gsub("N","");t=length();gsub(/[GC]/,"");print int((t-length())/t*100)/100}'https://stackoverflow.com/questions/24372420
复制相似问题