目前,我是摩西的新手,并且已经训练了一些网站上提供的样本数据集。我正在寻找更多的数据集来训练系统。这些可以在网上买到吗?在google上搜索时,我应该看什么?
发布于 2015-04-24 10:21:28
您可以在以下位置找到一些语料库:http://opus.lingfil.uu.se
此外,一些开源应用程序包括其双语PO文件,但您必须检查许可证。
我的建议是构建一个垂直的(即特定领域的)机器翻译系统,而不是通用的,以获得更好的结果。因此,此决定将影响您选择的语料库。
我希望这能帮到你!
https://stackoverflow.com/questions/29514306
复制相似问题