我是机器学习的初学者,我想知道是否有可能将机器学习应用于以下情况。
我正在将一个混合语言字符串(英语+其他任何东西)传递给机器学习库,我希望库告诉我这个字符串是否已经从英语完全翻译到目标语言。例如
示例1:
示例2:
如果机器学习可以应用于此,那么我应该如何选择输入字符串的维数,以及应该选择哪种算法(逻辑回归还是神经网络?)
谢谢
发布于 2014-10-31 05:00:57
自然语言处理是一个庞大而多样的领域。你可以考虑你的例子,有很多种方法。
第一个是字符集和符号编码。大多数非浪漫语言的字符将超出标准的26个字母。如果您在语言的核心字符范围内和外部看到字符,那么它就需要大量字典。
第二种方法是查看一组特定语言中的示例或单词,并使用朴素贝叶斯分类将某些训练集中的单词与语言关联起来。
你也许可以做更深入的茎检测等等,但我对它们的研究还不够深入。考虑张贴在交叉验证。
https://stackoverflow.com/questions/26667724
复制相似问题