首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >生物域数据集(如word2vec和手套中的词相似数据集)

生物域数据集(如word2vec和手套中的词相似数据集)
EN

Stack Overflow用户
提问于 2016-06-21 17:28:14
回答 1查看 75关注 0票数 1

我正在对word2vec进行生物医学方面的培训。为了执行单词相似性和词类比测试,我希望有一对具有相同关系的生物医学术语(可能是任何关系),就像我们在word2vec中有一个完整的城市州数据列表一样。我尝试搜索网页,但由于我是新的领域,我发现它令人困惑。

那么,在哪里可以找到与药物基因或蛋白质作用等相关的清单呢?或者我怎么才能挖掘这些数据。请建议公开提供这类数据集。此外,请提出任何其他有趣的关系,我也可以查询。

另一种方法是使用可用的本体论,因为它们包括概念之间的关系,如有部分、有向、有原因、有症状等。我能用本体论来提取这样的对吗?如果是,那是什么本体论和如何?

是否有任何金本位数据集可以为我的目的服务?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-06-22 10:08:46

那么,在哪里可以找到与药物基因或蛋白质作用等相关的清单呢?

看一看ChEMBL,例如阿司匹林链接到目标环氧化酶

另一种方法是使用可用的本体论,因为它们包括概念之间的关系,如有部分、有向、有原因、有症状等。我能用本体论来提取这样的对吗?如果是,那是什么本体论和如何?

ChEBI本体是一个很好的开端。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37950871

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档