假设GPT-2或GPT-3试图生成下一个令牌,并且它对不同可能的下一个令牌具有一个概率分布(在将softmax应用于某些输出逻辑之后)。它如何在文本输出中选择要使用的令牌?
GPT-2纸提到顶部k个随机抽样(引用"递阶神经层生成"),而从不提到波束搜索。GPT-3纸提到核采样(引用"神经文本退化的奇例")和束搜索(引用"用统一文本到文本转换器探讨迁移学习的局限性")。
发布于 2023-03-20 18:56:13
任何语言模型都可以用不同的方法生成文本:
k最可能的子序列(即“波束”);当解码完成后,输出最可能的子序列。k标记。p。temperature参数。top_p参数。您可以同时指定它们,但是OpenAI建议您只同时使用其中的一个。
如果您想知道这些方法的具体实现细节,可以查看Huggingface博客中的这个职位。
https://datascience.stackexchange.com/questions/120374
复制相似问题