参与生物信息学的人应该知道哪些数据结构?
我想每个人都应该知道列表、散列、平衡树等等,但我希望有特定于域的数据结构。有专门讨论这个问题的书吗?
谢谢,卢西恩
发布于 2010-11-30 08:00:42
如果要对大型数据集做任何工作,则需要学习如何有效地处理这些数据集。
只要想一想,如果你要对一个2GB的TIFF图像进行图像分析。或者在150 Gb的基因组数据集上进行序列匹配。
当你从“没有什么是慢的”转变为“这个操作是快速的,这是非常非常慢的,但是然后这些操作是快速的”思维方式,你的算法往往会改变。操作内存中的数据相对于必须始终从磁盘获取数据相对便宜,而在cpu缓存中操作数据相对于必须始终从内存中获取数据相对便宜。换句话说,考虑到这一点的算法会更快地产生更快的结果、更多的出版物、更多的名声和诺贝尔奖。
发布于 2010-11-30 08:30:49
我想不出任何数据结构是真正独特的生物信息学。在生物信息学中,有很多常见的算法,但在一般商业编程中并不常见。例如,动态规划总是会出现。请注意,这与动态类型无关,而是用于展开递归调用的有效技术。
有几十本关于生物信息学算法的书。我可以从头顶上说出几个好的例子:生物序列分析和生物信息学算法简介。
https://softwareengineering.stackexchange.com/questions/22468
复制相似问题