首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >蛋白质相互作用网络聚类算法的研究结果

蛋白质相互作用网络聚类算法的研究结果
EN

Stack Overflow用户
提问于 2015-12-10 20:23:23
回答 1查看 84关注 0票数 0

我正在做一个涉及蛋白质相互作用网络聚类的项目,在相互作用的蛋白质图上做了几个聚类算法,我有点困惑,现在我要如何去看看所创建的集群是否有用。

为了将其纳入上下文,蛋白质相互作用网络代表了蛋白质与参与相同生物过程或共同履行特定功能的相互作用蛋白质群之间的成对连接。这是很重要的,因为许多蛋白质和相互作用是没有标记的,因此,如果某个特定的标记蛋白在一个簇中,就可以推断它们的功能。

与典型的有监督机器学习任务不同的是,标记数据集可以显示正确分组的数目,因此没有迹象表明蛋白质的良好聚类及其相互作用,假设一个聚类中所有的蛋白质都在一个集群中,就像所有的蛋白质都在一个集群中一样好(尽管在这个集群中没有信息意义)。当然,距离计算也没有特征向量,只有二进制信息--不管一种蛋白质是否与另一种蛋白质相互作用,所以这是相当困难的。

这个问题完全是探索性的,很难看出集群是重要的还是虚假的。

大多数学术论文使用聚类分析技术来观察聚类和算法的优劣。即。是否对边缘缺失或节点缺失、聚类相关等有很强的鲁棒性。我想看看是否有任何信息可以利用蛋白质数据库进行挖掘,比如输入大量的相互作用(来自一个簇),看看标记的信息是否有参与同一代谢过程的倾向。如果在一个代谢过程中有大量的蛋白质参与,人们可以推测,这些未标记的蛋白质可能参与了类似的过程或功能,或者类似地可能是一个蛋白质结构域的一部分。

我刚刚开始深入研究生物信息学和研究,所以我很有可能已经做过这件事,而且我对此的研究还不够广泛。如果是这样的话,我将非常感谢链接。我希望有任何可能的帮助,或关于如何思考这个问题的想法。

EN

回答 1

Stack Overflow用户

发布于 2015-12-11 15:14:14

如果我理解你的问题:你想知道你的集群蛋白质相互作用网络是否识别出与生物相关的蛋白质复合物.

我可以想出三种方法来做到这一点:

1)运用初步研究文献。取一个集群,搜索Pubmed中的每个成员,并查看是否有与集群其他成员交互的报告。这将是费时但最严格的。

( 2)提交每一组进行术语充实分析(David、funcassociate等)或者路径分析(Kegg)。如果一个集群“在生物学上”相关,就应该为具体的GO/Kegg术语进行充实。只有在大多数蛋白质都有注释的情况下,这才能起作用。

3)查看表达式数据。生物复合体往往有相关的基因表达模式。对于集群的表达式,应该与其成员相关,而不是与集群的非成员关联。

我想到了第四个:

4)在一个具有丰富而深刻的注释数据库的生物体中寻找同源基因,并寻找它们之间的关联关系(酵母(酿酒酵母或柚木酵母*)、苍蝇(D.黑色素菌)、蠕虫(线虫)、小鼠和人类,它们都有较大的蛋白质相互作用数据库(即生物基因)。

第五名:

5)利用基因筛选数据。在这种情况下,遗传上位性数据将有明显的关系复杂。处于同一复杂环境中的蛋白质往往不存在遗传相互作用。而在单独/独立作用的复合物中的蛋白质可能有一个遗传相互作用的成分。见Charles Boone博士(大学)的工作。(多伦多)关于如何建模的。

最后的想法:

一点点特定领域的知识将大大有助于帮助他人相信你的结果。众所周知的/被研究的复合物是否形成团簇?在这个领域已经做了很多工作,Pubmed将成为您的朋友。从“沼气”开始,从那里开始锻炼。

祝好运

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34211045

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档