我正在尝试从维基百科的文章中提取知识图谱。为了提取必要的三元组,我使用了斯坦福CoreNLP。不幸的是,挖掘出的三元组的质量没有达到我的预期。
示例:
约翰·卡尔·弗里德里希·高斯是一位德国数学家和物理学家,他在数学和科学的许多领域做出了重大贡献。高斯有时被称为普林斯数学家,在数学和科学的许多领域都有特殊的影响。
(physicist,make contribution to, many field)
有什么技巧可以提高我的成绩?有没有更好的工具来从文本中挖掘三元组?
发布于 2019-04-18 22:03:35
这里有一个用Java编写的解决方案:
https://github.com/sunil3590/artificial-guy
使用的是斯坦福大学的CoreNLP。根据项目的main method,作者已经实现了:
https://stackoverflow.com/questions/52913932
复制相似问题