首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >机器学习在混合语言分析中的应用

机器学习在混合语言分析中的应用
EN

Stack Overflow用户
提问于 2014-10-31 04:49:00
回答 1查看 53关注 0票数 1

我是机器学习的初学者,我想知道是否有可能将机器学习应用于以下情况。

我正在将一个混合语言字符串(英语+其他任何东西)传递给机器学习库,我希望库告诉我这个字符串是否已经从英语完全翻译到目标语言。例如

示例1:

  • 输入:"i amor iphone“#(我喜欢西班牙语的iphone )
  • 预期结果: 不需要将来翻译,因为'iPhone‘是一个品牌名称

示例2:

  • 投入: "请upload您的文件“#(请用中文上传您的文件)

  • 预期结果: 需要以后翻译成中文,因为“上传”是一个应该翻译的动作。

如果机器学习可以应用于此,那么我应该如何选择输入字符串的维数,以及应该选择哪种算法(逻辑回归还是神经网络?)

谢谢

EN

回答 1

Stack Overflow用户

发布于 2014-10-31 05:00:57

自然语言处理是一个庞大而多样的领域。你可以考虑你的例子,有很多种方法。

第一个是字符集和符号编码。大多数非浪漫语言的字符将超出标准的26个字母。如果您在语言的核心字符范围内和外部看到字符,那么它就需要大量字典。

第二种方法是查看一组特定语言中的示例或单词,并使用朴素贝叶斯分类将某些训练集中的单词与语言关联起来。

你也许可以做更深入的茎检测等等,但我对它们的研究还不够深入。考虑张贴在交叉验证。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26667724

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档