在Stanford中,我需要从作为词汇解析输出的依赖解析树中提取表单NP-VP-NP的三元组。
做这件事的最好方法是什么。例如,如果解析树如下所示:
(ROOT
(S
(S
(NP (NNP Exercise))
(VP (VBZ reduces)
(NP (NN stress)))
(. .))
(NP (JJ Regular) (NN exercise))
(VP (VBZ maintains)
(NP (JJ mental) (NN fitness)))
(. .)))我需要提取两个三胞胎:
有什么想法吗?
发布于 2015-11-16 14:34:23
这里有两种自然的选择。一个是在依赖树上运行塞姆格 (边注:问题中有一个选区树),其模式如下:
{pos:/V.*/}=verb >/.subj.*/ {}=subject >/.obj/ {}=object
另一种选择是使用斯坦福大学开放IE系统。这将为您提供“(subject;relation;object)”三元组的更广泛的语义,其中关系不必是动词。
https://stackoverflow.com/questions/33733669
复制相似问题