问机器学习在混合语言分析中的应用
EN

Stack Overflow用户

提问于 2014-10-31 04:49:00

回答 1查看 53关注 0票数 1

我是机器学习的初学者，我想知道是否有可能将机器学习应用于以下情况。

我正在将一个混合语言字符串(英语+其他任何东西)传递给机器学习库，我希望库告诉我这个字符串是否已经从英语完全翻译到目标语言。例如

示例1：

输入："i amor iphone“#(我喜欢西班牙语的iphone )
预期结果：不需要将来翻译，因为'iPhone‘是一个品牌名称

示例2：

投入： "请upload您的文件“#(请用中文上传您的文件)

预期结果：需要以后翻译成中文，因为“上传”是一个应该翻译的动作。

如果机器学习可以应用于此，那么我应该如何选择输入字符串的维数，以及应该选择哪种算法(逻辑回归还是神经网络？)

谢谢

machine-learning

回答 1

Stack Overflow用户

发布于 2014-10-31 05:00:57

自然语言处理是一个庞大而多样的领域。你可以考虑你的例子，有很多种方法。

第一个是字符集和符号编码。大多数非浪漫语言的字符将超出标准的26个字母。如果您在语言的核心字符范围内和外部看到字符，那么它就需要大量字典。

第二种方法是查看一组特定语言中的示例或单词，并使用朴素贝叶斯分类将某些训练集中的单词与语言关联起来。

你也许可以做更深入的茎检测等等，但我对它们的研究还不够深入。考虑张贴在交叉验证。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/26667724

复制

相似问题

问机器学习在混合语言分析中的应用
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问机器学习在混合语言分析中的应用EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问机器学习在混合语言分析中的应用
EN