我有一个DNA序列,像这样:cgtcgctgtttgtcaaagtcg....
这可能是1000+字母的长度。
但是,例如,我只想查看字母5到200,并将字符串的这个子集定义为新对象。
我尝试查看nchar函数,但没有找到可以做到这一点的东西。
发布于 2009-09-28 23:15:17
试一试
substr("cgtcgctgtttgtcaa[...]", 5, 200)参见substr()。
发布于 2009-09-28 23:16:20
使用substring函数:
> tmp.string <- paste(LETTERS, collapse="")
> tmp.string <- substr(tmp.string, 4, 10)
> tmp.string
[1] "DEFGHIJ"发布于 2009-09-30 12:25:21
另请参阅Bioconductor package Biostrings,如果您需要处理大型生物序列或序列集,这是一个很好的选择。
#source("http://bioconductor.org/biocLite.R");biocLite("Biostrings")
library(Biostrings)
s <-paste(rep("gtcgctgtttgtcaac",20),collapse="")
d <- DNAString(s)
d[5:200]
as.character(d[5:200])https://stackoverflow.com/questions/1489788
复制相似问题