我只是在努力找出如何在keras/tensorflow嵌入层中为OOV单词使用快速文本词向量。外面什么都没有。也许有人也想到了这一点,并给了我一些提示?
通过词嵌入查找的方式通过像tf.nn.embedding_lookup(word_embeddings,x)这样的索引工作
你可以有一个OOV的索引。但我如何在运行时分配一个特定的向量(来自不同的自定义来源,如fasttext)?
我想象一个函数,它可以自定义地为OOV单词的UNK索引分配一个向量。
与此相关的:
Assign custom word vector to UNK token during prediction?
Using subword information in OOV token from fasttext in word embedding layer (keras/tensorflow)
发布于 2019-09-22 19:08:22
您可以在tensorflow之外执行嵌入查找\计算,并使用嵌入的文本作为模型的输入(因此输入将不是一系列单词索引,而是一系列向量)
https://stackoverflow.com/questions/56399816
复制相似问题