在人工智能方法中,我们有两个阶段的训练。这些阶段是数据和测试。
在训练阶段,我们给系统提供大量的数据,而我们通常用较少的数据量来测试它。然后我们评估输出。
现在的问题是,这种培训是否可以通过嵌入在GIZA++中的内置功能来完成,或者我们应该为此编写一个单独的应用程序?
如果我们要写一个单独的应用程序,有没有人可以帮我推荐一个已经写好的应用程序呢?还是手册?注意:我希望有一个对齐程序,而不是一个统计机器翻译
我更喜欢在Giza++中训练,这样我就可以用未观察到的数据进行测试。
提前谢谢。
发布于 2014-07-09 19:21:17
这应该是使用Moses训练基线mt系统的一个很好的起点。
通常,GIZA++用于对平行语料库进行单词对齐。
您还需要一些其他工具来进行语言模型估计,比如IRSTLM、SRILM或KenLM。
https://stackoverflow.com/questions/12173503
复制相似问题