首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在GIZA++的mkcls文件中,单词是如何聚集成word类的,它们是基于什么分类的?

在GIZA++的mkcls文件中,单词是如何聚集成word类的,它们是基于什么分类的?
EN

Stack Overflow用户
提问于 2014-10-16 07:48:06
回答 1查看 282关注 0票数 0
  1. mkcls在giza++中的用途是什么?
  2. 在运行mkcls时,giza++为源语言和目标语言生成四个文件*.vcb.classes和*.vcb.classes.cats。

*.vcb.classes的输出是:

代码语言:javascript
复制
.      9
book  10
gave   4
he     3
him    5
i      7
loved  8
read   8
the    2

这个数字指的是什么?是单词类号码吗?如果它是一个单词类数,那么它是如何生成的,或者它是如何被分类成不同的类的,基于什么?

EN

回答 1

Stack Overflow用户

发布于 2014-10-24 12:25:32

“mkcls”程序将单词分组为等价类。输出由GIZA++用于字对齐。请参阅Franz Josef Och,一种有效的双语词汇分类方法

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26398942

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档