首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >存储从信息抽取中获取的数据

存储从信息抽取中获取的数据
EN

Stack Overflow用户
提问于 2015-02-04 11:09:01
回答 1查看 168关注 0票数 1

我对java有一定的经验,我是学生,做我最后一年的项目。

我需要在自然语言处理的项目上工作,我目前正在斯坦福-nlp库上工作(但我没有被锁定,我可以改变我的工具),这样就可以为任何适合我的问题的工具提供答案。

我计划在信息抽取IE,并看到一些页面/pdf解释如何与各种NLP技术工作。数据将用NLP进行处理,我需要对所处理的数据执行信息检索IR

我现在的问题是:我应该使用什么数据结构或存储介质来存储我使用NLP技术检索到的数据

  • 该数据存储必须具有支持查询的能力。
  • XML,JSON看起来不是一个理想的候选者。(我可能错了):如果他们能够帮助或指导最好的方法,那将是有帮助的。
  • 我当前的观点是将解析树转换/存储为一种数据格式,可以直接读取以进行查询。(解析树:被解析的句子或字符串的结构的图表表示)

为了文本“我的项目是基于NLP的”,需要存储数据类型的示例。依赖性如下所示

根(根-0,基-4)

poss(项目-2,My-1)

nsubjpass(基-4,项目-2)

辅助(基-4,is-3)

准备(基-4,on-5)

pobj(on-5,NLP-6)

EN

回答 1

Stack Overflow用户

发布于 2015-02-11 01:05:07

您是否已经提取了信息,还是试图存储解析树?如果是前者,这仍然是NLP中的一个悬而未决的问题。例如,参见Jurafsky和Martin的书,书中讨论了许多方法来做到这一点。

基本上,我们不能回答,直到我们知道你想要储存的东西。如果它是超级简单的信息,那么您就可以使用一个简单的关系数据库了。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28319842

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档