首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何评估成对比对中的评分方案

如何评估成对比对中的评分方案
EN

Stack Overflow用户
提问于 2015-11-23 21:18:18
回答 1查看 92关注 0票数 0

我不是生物信息学的专家。我想用全局比对的方法对两个核苷酸序列进行比对。每个序列是{A,C,T,G}个字母的组合。

问题是我不知道如何选择最好的评分方案(变电站和空档惩罚)。

目前,我使用值+1,-1,-2表示匹配、不匹配和间隙惩罚。我意识到,人类DNA的转换次数比颠换次数要多。

我的问题是如何根据我的数据集估计(匹配,不匹配和差距)的惩罚。有没有什么统计模型可以帮上忙?

EN

回答 1

Stack Overflow用户

发布于 2015-11-23 21:33:35

如果我们需要回答这个问题,我们需要很好地了解数据集和您的作用域,但通常对于匹配/不匹配,我们可能表示为+1/-1,这不包括(颠倒和转换)。

我建议你看看这个modelKimura

最后,对于惩罚,你可以根据序列的不同使用“低,中,高”惩罚,我的意思是,如果有机体是紧密相关的,那么你可以使用低差距惩罚,而对于更多差异的有机体,高惩罚,所以差距惩罚取决于你所比对的序列的差异程度。

如果我们需要知道序列是否发散,正如我所说的,这取决于您的数据,并且根据您的数据而不同,但是您可以查看一些序列的示例:link1link2link3link4link5

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33872081

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档