KNIME附带了几个本地节点,用于执行不同的标记任务,例如POS标记或命名实体识别。为了使用已识别的标记或术语,可以使用“单词袋”节点,该节点生成术语(而不是单词)和相关的标记。但是,这种方法没有详细说明与每个单词相关联的标记,也没有详细说明标记(或单词)的顺序。
因此,如果您想要提取诸如'POS标签+/- N字相对于实际单词‘的功能(例如。一个字窗),你怎么能?
例如,对于“那个城市就是纽约”,我希望KNIME生成一个排序列表,如:(其中最后一个NN将是一个命名实体)。
发布于 2018-03-06 23:34:54
是的那是个问题。上周我也遇到了同样的情况。
如果您只想按单词获取POS,可以将标记链接到字符串节点到word节点的输出包,但我认为这种方法对于大型文档失败,因为对于同一个单词(某个单词的POS值由word的上下文决定),这种方法失败了。
现在,为了获得这个窗口('POS标记+/- N单词相对于实际单词‘),我的一个解决方案是通过命令行(外部节点或python/java代码)连接Freeling,并在返回的向量中获取每个单词对应的标记。
https://stackoverflow.com/questions/43163312
复制相似问题