首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >中文crf++中的单词标记和多词标记有什么不同?

中文crf++中的单词标记和多词标记有什么不同?
EN

Stack Overflow用户
提问于 2015-11-16 12:46:33
回答 1查看 55关注 0票数 0

我用crf++表示中文命名实体recognition.The,列车文件的第一列是token代表当前单词,我看到有人在第一列只用了一个汉字,但也有人用了很多像中国这样的汉字。

EN

回答 1

Stack Overflow用户

发布于 2015-11-16 13:06:03

中文单词可以是1个汉字,也可以是多个汉字:

中代表一个英文单词--中间。

国代表另一个英语单词- country。

中国代表英语单词--中国。

它们是相同的当前词-就像‘中国’有5个英文字符,中国有2个中文字符-两者都是cft++中的当前词。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33728677

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档