我对java有一定的经验,我是学生,做我最后一年的项目。
我需要在自然语言处理的项目上工作,我目前正在斯坦福-nlp库上工作(但我没有被锁定,我可以改变我的工具),这样就可以为任何适合我的问题的工具提供答案。
我计划在信息抽取IE,并看到一些页面/pdf解释如何与各种NLP技术工作。数据将用NLP进行处理,我需要对所处理的数据执行信息检索IR
我现在的问题是:我应该使用什么数据结构或存储介质来存储我使用NLP技术检索到的数据。
为了文本“我的项目是基于NLP的”,需要存储数据类型的示例。依赖性如下所示
根(根-0,基-4)
poss(项目-2,My-1)
nsubjpass(基-4,项目-2)
辅助(基-4,is-3)
准备(基-4,on-5)
pobj(on-5,NLP-6)
发布于 2015-02-11 01:05:07
您是否已经提取了信息,还是试图存储解析树?如果是前者,这仍然是NLP中的一个悬而未决的问题。例如,参见Jurafsky和Martin的书,书中讨论了许多方法来做到这一点。
基本上,我们不能回答,直到我们知道你想要储存的东西。如果它是超级简单的信息,那么您就可以使用一个简单的关系数据库了。
https://stackoverflow.com/questions/28319842
复制相似问题