我知道词性标注句中的每一个单词都带有适当的词性,但这不正是分析者所做的吗?也就是说,把一个句子分成几个部分?我在网上查过这个,但没有找到令人满意的解释。请澄清我的疑虑。提前感谢
发布于 2020-04-26 19:09:52
它们是两个不同的程序:
POS标记使用了一个标记化的单词序列,并返回一个带注释的标记列表,其中每个标记都有一个word类标签。这通常通过查看令牌周围的上下文来消除歧义。
还有https://en.wikipedia.org/wiki/Shallow_parsing,它将符号组合成相关的组(如名词短语)。块是不重叠的序列。
解析通常会导致一个句子的解析树;在出现歧义句的情况下,通常会有许多可能的树。
POS标记通常是解析中的一个准备步骤,因为解析器通常对word类进行操作(尽管有一些解析算法可以直接处理令牌,或者是标记和标记的混合)。
https://stackoverflow.com/questions/61446106
复制相似问题