我试图将生物病毒的序列表示为ATGCs,但我已经看到了代码,其中它被表示为1234s。如果我们将其存储为整数[1,2,3,4]而不是字母[A,T,G,C],那么在内存使用和代码速度上有什么差异吗?
对于那些可能需要更多上下文的人,我不会对数字/字母串做任何数学操作,只会在随机位置(即突变)更改他们的身份,跟踪字典中的参考序列(例如:{2:'G', 52:'A'}或{2:3, 52:1})中的变异位置,并通过迭代参考序列并检查突变字典中的任何突变来导出任何生物病毒株的完整序列。
发布于 2014-05-28 15:01:19
字符串或整数的使用取决于DNA序列的大小。我知道有些序列可能有上百万种元素。如果您正在处理大量信息,最好使用类型化整数。否则,您可以使用字符串,如果它更适合您。
https://stackoverflow.com/questions/23914274
复制相似问题