首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否可以对FastText模型进行微调

是否可以对FastText模型进行微调
EN

Stack Overflow用户
提问于 2019-09-05 13:17:51
回答 1查看 3.8K关注 0票数 2

我正在做一个使用FastText的文本相似度项目,我找到的训练模型的基本例子是:

代码语言:javascript
复制
from gensim.models import FastText

model = FastText(tokens, size=100, window=3, min_count=1, iter=10, sorted_vocab=1)

据我所知,由于我指定了向量和ngram大小,模型在这里是从头开始训练的,如果数据集很小,我会检测出很好的结果。

我发现的另一个选择是加载原始的维基百科模型,这是一个很大的文件:

代码语言:javascript
复制
from gensim.models.wrappers import FastText

model = FastText.load_fasttext_format('wiki.simple')

我的问题是,我可以加载维基百科或任何其他模型,并根据我的数据集对其进行微调吗?

EN

回答 1

Stack Overflow用户

发布于 2019-09-10 11:30:30

如果您有一个带标签的数据集,那么您应该能够对其进行微调。This GitHub issue解释说,您希望使用pretrainedVectors选项。您将从维基百科预先训练的向量开始,然后在您的数据集上进行训练。似乎gensim可以做到这一点,但根据this GH issue的说法,已经有了一些bug。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57798839

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档