我想用"gensim“来训练Word2Vec模型。我想确定最初的评级率。但是,可以使用"alpha“和"start_alpha”参数来实现这一目的。他们之间有什么区别?是一样的吗?
发布于 2021-01-03 17:33:47
参数alpha用于构造函数
classgensim.models.word2vec.Word2Vec(sentences=None,corpus_file=None,vector_size=100,alpha=0.025,window=5,min_count=5,max_vocab_size=None,sample=0.001,seed=1,workers=3,min_alpha=0.0001,sg=0,hs=0,negative=5,ns_exponent=0.75,cbow_mean=1,hashfxn=,ns_exponent=0.75,en19#,(),,)
而参数start_alpha在火车方法中使用:
火车(corpus_iterable=None,corpus_file=None,total_examples=None,total_words=None,epochs=None,start_alpha=None,end_alpha=None,word_count=0,queue_factor=2,report_delay=1.0,compute_loss=False,callbacks=(),**kwargs)
至于使用哪一种:
start_alpha(浮动,可选)-初始学习率。如果提供,则替换构造函数中的启动alpha,用于这一次对train()的调用。只在您想自己管理alpha学习率(不推荐)时,只在进行多次电话培训()时使用。
发布于 2021-01-03 18:49:11
它们本质上是一样的。如果在构造函数中指定非默认值:
alpha & min_alphasentences/corpus_iterable/corpus_file),中指定培训语料库,则alpha & min_alpha将成为自动.train()的start_alpha、end_alpha如果您相反地显式地调用.train():
start_alpha & end_alpha,它将用于代替构造函数期间设置的值(但不会在模型中缓存以供以后调用),如果你在同一个模型上多次调用.train(),某种原因--这通常是一个不必要的坏主意,除非在一些非标准的专家--使用情况下--很可能您希望正确地选择每个调用的alpha范围的正确级数(这样它就不会毫无意义地上下跳)。
专家的使用是独立的、非缓存的start_alpha和end_alpha参数存在的真正原因。大多数用户应该坚持默认设置(所以不要使用其中的任何一个),如果他们确实达到了修补的地步,只需在构造函数中尝试不同的alpha值,仔细监视它是否有用。
https://stackoverflow.com/questions/65549685
复制相似问题