Word2vec是一个很好的工具是deeplearning4j。我在这个教程之后为一个语料库创建了一个向量。
Word2vec
现在的问题是如何用新的句子更新模型,而不必从头开始重建它。
对此有一些思考,这种方法会有帮助吗?
public void trainSentence(List<VocabWord> sentence){}
这会更新模型吗?如果是的话,如何准备将句子发送给这种方法?
发布于 2016-05-03 18:29:18
是也不是。在文档这里中,它提到:
添加模型序列化/反序列化后的权重更新。也就是说,您可以使用200 of的新文本更新模型状态,方法是调用loadFullModel,向其添加TokenizerFactory和SentenceIterator,并在恢复的模型上调用fit()。
loadFullModel
TokenizerFactory
SentenceIterator
fit()
这意味着可以对模型权重进行再培训,并使用新的语料库进行更新。但是这个词不会被添加到单词中。
检查代码和Javadoc 这里。
https://stackoverflow.com/questions/36989291
相似问题