首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Grakn:我如何从文本集合中构建知识图谱?

Grakn:我如何从文本集合中构建知识图谱?
EN

Stack Overflow用户
提问于 2020-03-26 21:52:57
回答 2查看 359关注 0票数 6

我的笔记本里有几个文档(pdf和txt),我想用Grakn构建一个知识图谱。

我通过谷歌找到了blog,但没有文档或自述文件教我如何做到这一点。

也写在博客“可以在我们的GitHub repo here上找到挖掘文本的脚本”,但我不能理解我必须做的事情。

这里有人能建议我如何使用Grakn从文本构建知识图谱吗?

EN

回答 2

Stack Overflow用户

发布于 2020-03-28 06:34:38

Grakn是一个知识引擎/网络,它通过定义良好的实体和关系(本体)来理解知识,因此您需要使用自然语言处理(Natural Language processing,NLP )来使图形网络能够访问人类语言。此外,您还需要OCR (光学字符识别)来将一些图像文本转换为文本。你还应该教网络基本的本体论来理解文本。你实际上正在经历奇点时代。

票数 3
EN

Stack Overflow用户

发布于 2020-04-17 01:43:44

为了给出一个如何从文本集合到知识图谱的示例,让我们假设您的所有文本都与某个知识领域有关-在您提到的博客文章的示例中,我们正在处理生物医学研究出版物。

第一步可能是在文本中找到实体,或定义的“事物”。为了坚持生物医学的例子,我们可以寻找出版物中提到的药物和基因。这被称为命名实体识别(NER),这是一种应用于文本挖掘的技术。

如果某一种药物经常在同一出版物中被提及为特定的基因,它们就会“共同出现”,并且很可能在某种程度上相关。这将是一种关系的例子。准确地说它们是如何相关的自动提取是一个困难的问题,被称为关系提取(RE)。

NER和RE的解决方案通常是特定于领域的(从字典术语的简单匹配到AI模型)。

如果您对文本挖掘感兴趣,那么可以从NLTK开始学习python。

知识图谱的思想是将已定义的事物,称为实体,放在彼此之间的已定义关系中,以创建上下文。在您有了在所有文档中找到的实体列表以及它们之间的关系(如上面的示例,文档中的共现,甚至是一个句子)之后,您可以定义一个模式并将这些实体和关系上传到grakn中,并使用它的所有功能来分析您的数据。

有关如何对已提取的数据使用grakn的教程,请参阅see here

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60868882

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档