我下载了一个.bin FastText模型,并将其与gensim一起使用,如下所示:
model = FastText.load_fasttext_format("cc.fr.300.bin")我想继续培训的模式,以适应我的领域。在检查了FastText's Github和Gensim文档之后,似乎是,而不是,使用这个人提出的改性 (尚未合并)是可行的。
我是不是遗漏了什么?
发布于 2019-07-08 02:25:03
您可以继续在Gensim的fastText的某些版本中进行培训(例如,v.3.7.*)。这里是"装货、推理、继续训练“的一个例子
from gensim.test.utils import datapath
model = load_facebook_model(datapath("crime-and-punishment.bin"))
sent = [['lord', 'of', 'the', 'rings'], ['lord', 'of', 'the', 'semi-groups']]
model.build_vocab(sent, update=True)
model.train(sentences=sent, total_examples = len(sent), epochs=5)由于某些原因,gensim.models.fasttext.load_facebook_model()在Windows上丢失,但在Mac的安装中却存在。或者,人们可以使用gensim.models.FastText.load_fasttext_format()加载经过训练的模型并继续进行培训。
下面是各种预训练的Wiki字模型和向量 (或这里)。
另一个例子。注:与Word2Vec的情况一样,您可以继续培训您的模型,同时使用Gensim的原生fastText实现。
发布于 2018-09-03 01:22:26
官方的FastText实现目前不支持这一点,尽管有一个与此问题相关的公开票证,您可以找到这里。
https://stackoverflow.com/questions/52080365
复制相似问题