在自然语言处理->词性标注中,树是如何形成的。这背后的算法是什么?(S (NP爱丽丝) (VP (V追逐) (NP (检测) (N兔)
例如,Det "the“和”N“兔”如何成为NP (在NP下分组?)树形成和节点聚合背后的算法是什么
发布于 2015-11-07 00:44:32
您在这里的意思基本上称为解析,而不是POS标记。POS只关心将正确的POS标签分配给一个单词(即DT表示' the‘,NN表示'dog')。
在句法分析中,这些信息被用来分析句子。有依赖解析器和成分解析器。漂亮的树通常是为组成树绘制的。为了解析一个句子,你需要一个语法。语法由一组规则组成,这些规则说明如何构建成分。这是一个非常简单的语法示例:
S -> NP VP
NP -> DT NN
VP -> V这个语法可以成功地解析简单的句子
'the dog barks'至
(S (NP (DT the) (NN dog)) (VP (V barks))))有很多不同的解析算法。最简单的算法之一是shift-reduce算法。然后还有更复杂的算法,如CYK解析器,LL/LR解析器。此外,还有自下而上和自上而下的解析。我想你最好在这里做一些基本的阅读。在这里你可以找到不同的算法:https://en.m.wikipedia.org/wiki/Category:Parsing_algorithms
解析的一个很好的介绍:http://dickgrune.com/Books/PTAPG_2nd_Edition/
https://stackoverflow.com/questions/33571234
复制相似问题