*.vcb.classes的输出是:
. 9
book 10
gave 4
he 3
him 5
i 7
loved 8
read 8
the 2这个数字指的是什么?是单词类号码吗?如果它是一个单词类数,那么它是如何生成的,或者它是如何被分类成不同的类的,基于什么?
发布于 2014-10-24 12:25:32
“mkcls”程序将单词分组为等价类。输出由GIZA++用于字对齐。请参阅Franz Josef Och,一种有效的双语词汇分类方法
https://stackoverflow.com/questions/26398942
复制相似问题