这可能更像是一个数学题,但我在其他地方找不到任何相关的文档。
我只想弄清楚在GIZA++中使用哪个方程来计算对齐得分。
可能有人有什么主意吗?
谢谢你提前提供帮助。
发布于 2013-11-29 15:09:51
如果有帮助,我找到了本文件,其中包括以下描述:
使用word类的依赖关系实现完整的IBM4对齐模型(Brown等人)。(1993年)
在此之后,您可以找到一篇题为“统计机器翻译的数学:参数估计”的论文,您可以找到这里的PDF格式。
本文详细介绍了5种对齐模型的数学基础,这些数学模型过于冗长,无法粘贴在这里。也许您可以在它对Model 4的描述中看到这一点是否足够详细,我假设这是GIZA++所使用的。
还有此PDF,它总结了模型和培训过程。
发布于 2013-12-01 05:14:48
总之,在期望最大算法的多次迭代中学习词对齐和翻译概率。
菲利普·科恩的“统计机器翻译”中有一章是关于词对齐的。有关更多信息,请查看statmt.org。
https://stackoverflow.com/questions/20120928
复制相似问题