首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在CRF++中使用目标标签作为特征?

如何在CRF++中使用目标标签作为特征?
EN

Stack Overflow用户
提问于 2015-12-18 19:52:46
回答 1查看 303关注 0票数 0

我正在尝试构建一个中文分词程序,名为this paper。如果我理解正确的话,他们在CRF++中使用了两个标签的分割方法。我的问题是,如何将论文中的标签转换(例如T(-1)C(0)T(0))作为CRF++中的特征模板?例如,对于这样的训练数据:

共B

同M

創B

造M

美B <-当前字

好M

的B

新B

世B

紀M

在CRF++中是否可以有特性T(-1)C(0)T(0) -> M/美/B?我尝试添加诸如U01:%x-1,1/%x0,0/%x0,1的特征模板,但是失败了。我也很困惑,既然B/I标签是我们想要在测试数据(例如原始中文句子)中标记的标签,为什么可以在论文中使用该标签作为特征?或者我误解了什么?

EN

回答 1

Stack Overflow用户

发布于 2016-04-13 02:48:15

像CRF++中的T(-1)C(0)T(0) -> M/美/B这样的特性可以表示为:

B01:%x0,0

注意不同之处。B,不是U

如果使用U01:%x0,0,则表示类似于"美/B“的功能。

当我6年前第一次使用CRF++时,这也让我感到有点困惑。希望这能对你有所帮助。

值得一提的是,在CRF中,功能的描述将包括标签。我的意思是,以下是一个0-1特征:当前字符是"美“,当前标签是"B"

CRF++(这是一个工具实现的CRF)中的“模板”所做的是枚举给定模板中定义的上下文的所有标签。

因此,在您的示例中,U01:%x0,0自动引入了两个特性:"U01:美_y=B“和"U01:美_y=M”

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34355086

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档