我正面临着一个问题,那就是找出基因本体论术语的水平和类型的正确定义。
我知道GO术语的类型与isA图相关,而不考虑partOf关系。但当我遇到以下情况时,我仍然感到困惑:
查找关卡时:
如果我有GO:123 (假设它是根),指向GO:345和GO:567,在两个链接中都有isA关系。此外,GO:345指向术语GO:567与partOf关系。
现在,围棋的级别是多少:567?它是不是因为根指向它而是2?或者它是3,因为根的儿子指向它?在图形的级别和类型中,我应该如何处理这种情况?
发布于 2012-10-01 20:40:08
把这个问题带到Biostar上,你可能会得到更多有用的答案。或者是GO website和GO mailing lists。
你提出的问题直接源于GO的语义。它是一个有向无环图(DAG),因此节点没有深度或级别的单一定义。如果您想要一个一致的定义,可以选择使用min(深度)或max(深度),但这对于您的应用程序可能不是一个好的选择,因为您没有对其进行描述。同样,图的边具有描述不同生物学关系的不同属性(“是一个”、“部分”和“调节”)。
如何最好地处理这些属性取决于您想要完成什么,或者您想要对数据进行什么查询。由于GO术语对基因的注释密度在有机体和术语之间差异很大,因此您可能更好地考虑度量特定上下文中注释的信息量,而不是图中的“深度”。
https://stackoverflow.com/questions/12663388
复制相似问题