首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >google键盘使用哪种算法来实现自动建议(包括个人词汇)?

google键盘使用哪种算法来实现自动建议(包括个人词汇)?
EN

Stack Overflow用户
提问于 2019-12-12 15:43:25
回答 1查看 168关注 0票数 1

我很困惑,因为google不能用每个人的个人词汇来训练他们的文本生成模型。

我试图开发类似的东西,但在神经网络训练期间,当类的数量变得动态时,我被卡住了。

如果我不知道类的数量,1怎么能给出层的大小和输入的尺寸。

假设谷歌知道英语词汇中的单词,我把我的俚语中的一些单词放到了我的个人词典中,它能够在将来向我推荐这些单词。

假设谷歌词汇由10个单词组成,我给它一个序列中的5个单词,它将它们编码成1和0的(5x10)向量的大小。

然后我加入了4个新单词。现在总单词大小= 14

但是RNN (如果使用)是使用只有10个单词的单词大小进行训练的。它不能对这些新单词进行编码,因为这些单词在训练时不属于单词。

它是否使用(5x14)大小的向量重新训练其文本生成模型?

EN

回答 1

Stack Overflow用户

发布于 2019-12-12 16:17:13

根据这个谷歌AI article,他们使用了两个东西的组合:

  • Neural空间模型:解决字符级别的认知和运动错误(表现为拼写错误、字符插入、删除或交换等)。他们使用从speech processing.
  • Finite-State Transducers得到的CTC损失函数训练的字符级LSTM模型:该模型提供语言词汇约束(语言中出现的单词)和语法约束(单词可能紧跟在其他单词之后)。后者使用概率n元语法模型来表示键盘的语言模型。

在您的情况下,我建议如下:

你的RNN需要在character-level上进行训练,而不是在单词级别上进行训练,以跟踪misspellings.

  • Use,一个n-模型,用于跟踪哪些单词通常伴随哪些单词。这需要在您首选的vocabulary.
  • Lastly,上进行训练虽然不容易,但它是可行的!!
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59299832

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档