我使用CRFSuite进行序列分类(POS标记)。令我惊讶的是,CRFSuite似乎不喜欢标签':‘单位或标记,因为真正的标签被完全跳过了(在预测输出中没有提到丢失或跳过的项)。
我使用其他与标点符号相关的标签,如'.‘。或者“,”,但这些都是正确使用和输出的。
有没有人做过类似的经历,或者现在为什么“:”被跳过?
发布于 2015-01-30 21:34:34
来自http://www.chokkan.org/software/crfsuite/tutorial.html
CRFsuite接受任何字符串作为属性名,只要该字符串不包含冒号字符(用于分隔属性名称及其权重)。
因此,如果您有像w=the:0.5这样的属性,则属性名为"w=the“,权重为0.5。
https://stackoverflow.com/questions/26016375
复制相似问题