我在python中使用了python-crfsuite包,python是Okazaki Naoaki (http://www.chokkan.org/software/crfsuite/)开发的CRFSUITE的一个实现。
我想使用上一个令牌的entity类作为一个功能,它将帮助我识别多个单词命名的实体。我的训练数据示例:
(Raheja,B-builder),(vista,I-builder),(is,O),(very,O),(有名,O)
在这里,如果我可以在预测时使用前面的类特征,同时training.but,我们将特征列表传递给标记器对象。测试时的问题是以前的类将是未知的。
有人能告诉我这在python-crfsuite中是不是可能的。我觉得我们把特性传递给标记器对象的方式是不可能的。
发布于 2015-09-08 09:33:39
基于tutorial中的这句话,我相信这在crfsuite (和python-crfsuite)中是不可能的。
不支持以属性和标签二元语法为条件的
要素。
发布于 2016-12-05 21:39:54
默认情况下,前一个令牌的类在CRFSuite中用作功能。CRFSuite使用两种功能:
状态功能“- I(current_label=A and f(sequence, current_position));
I(current_label=A and previous_label=B)您定义的特征实际上是(1)中的f函数;状态特征是为标签的所有可能值生成的。要使用过渡特性,您不需要做任何事情,它们是默认生成的。
在CRFsuite中没有实现的是第三种特性:I(current_label=A and previous_label=B and f(sequence, current_position));这就是教程所说的“以属性和标签二元语法为条件的特性”。
https://stackoverflow.com/questions/31195940
复制相似问题