我最近试着复习一下中国的->英文系统。根据https://blogs.msdn.microsoft.com/translation/2017/11/15/microsoft-translator-accelerates-use-of-neural-networks-across-its-offerings/的说法,这些系统已经切换到NMT型号。也有声明说,当将类别设置为"SMT“时,用户仍然可以使用统计系统。
然而,https://blogs.msdn.microsoft.com/translation/2016/01/27/new-microsoft-translator-customization-features-help-unleash-the-power-of-artificial-intelligence-for-everyone/提到,实际上有三个标准类别可用于SMT引擎:一般(默认),技术,语音。
你能解释一下现在SMT类别提供哪个域名吗?它会在你这一边支持多久?
谢谢
发布于 2018-02-08 03:04:59
我们正在使用神经网络解码器进行定制。目前,Microsoft Translator Hub有3个用于SMT的类别ID,它们是一般、技术和语音。
对于不局限于您的域的内容,您可能会发现使用category=generalnn比使用当前的自定义更好。
发布于 2018-03-01 06:25:42
中文使用的是NMT系统,因此使用Category=generalnn将导致在使用Microsoft Translator Text API调用服务时产生相同的翻译。
第二篇文章介绍了定制,您可以根据您的领域、风格和术语创建自己的自定义翻译系统或词典。如果您对定制感兴趣(目前是SMT),这里有一些与使用Translator Text API和Microsoft Translator Hub相关的类别。该类别标识您使用集线器创建的项目的域。其中两个类别是技术和语音。
请参阅Microsoft Translator Hub User Guide以了解有关集线器的更多信息。
发布于 2018-03-09 07:44:56
技术类别只有在从英语翻译成其他语言时才会产生不同的结果。以English>Chinese为例,使用我的示例句子“我的计算机无法启动”,它就启动了。对于Chinese>English,指定"tech“将后退到默认值,在Chinese<>English的情况下是神经。"speech“在所有情况下都会生成与"generalnn”相同的结果。
通常情况下,包括Hub类别在内,在一种语言对中有效的类别在所有语言对中都有效。只有当类别根本不存在时,API才会失败,并显示“无效类别”错误。这种设计的原因是,随着时间的推移,您可以逐个语言地构建您的自定义系统,同时仍然允许用户在所有可用语言之间进行选择,代价可能是在尚未定制的语言对中偶尔出现不太理想的领域词汇表。
无论是否使用了自定义系统,API都不会返回给您。无论如何,获得该功能的一个技巧是使用字典条目为您的自定义系统添加水印。例如,创建一个转换为"CustomSystem180309_1700_en_ru“的字典条目"_mywatermark”,然后您可以随时在任何应用程序中进行测试,无论您是否正在获取自定义系统。
https://stackoverflow.com/questions/48568364
复制相似问题