我不是生物信息学的专家。我想用全局比对的方法对两个核苷酸序列进行比对。每个序列是{A,C,T,G}个字母的组合。
问题是我不知道如何选择最好的评分方案(变电站和空档惩罚)。
目前,我使用值+1,-1,-2表示匹配、不匹配和间隙惩罚。我意识到,人类DNA的转换次数比颠换次数要多。
我的问题是如何根据我的数据集估计(匹配,不匹配和差距)的惩罚。有没有什么统计模型可以帮上忙?
发布于 2015-11-23 21:33:35
https://stackoverflow.com/questions/33872081
复制相似问题