我正在对word2vec进行生物医学方面的培训。为了执行单词相似性和词类比测试,我希望有一对具有相同关系的生物医学术语(可能是任何关系),就像我们在word2vec中有一个完整的城市州数据列表一样。我尝试搜索网页,但由于我是新的领域,我发现它令人困惑。
那么,在哪里可以找到与药物基因或蛋白质作用等相关的清单呢?或者我怎么才能挖掘这些数据。请建议公开提供这类数据集。此外,请提出任何其他有趣的关系,我也可以查询。
另一种方法是使用可用的本体论,因为它们包括概念之间的关系,如有部分、有向、有原因、有症状等。我能用本体论来提取这样的对吗?如果是,那是什么本体论和如何?
是否有任何金本位数据集可以为我的目的服务?
https://stackoverflow.com/questions/37950871
复制相似问题