首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >向`tft.vocabulary`添加保留令牌

向`tft.vocabulary`添加保留令牌
EN

Stack Overflow用户
提问于 2022-04-06 17:38:59
回答 1查看 126关注 0票数 1

我想在tft.vocabulary创建的词汇表中添加一些单词,这些词汇不是训练样本的一部分(即<mask><pad>标记)。

我在文档中看到,tft.vocabulary函数可以接受一个参数,key_fn是这样说的:

如果您希望生成包含特定键的词汇表,则

提供key_fn。

但是,对于下面的key_fn,它仍然没有将<mask><pad>标记附加到词汇表中。

代码语言:javascript
复制
def _key_fn(x):
  return tf.constant(['<mask>', '<pad>'])

vocab = tft.vocabulary(
  words,
  key_fn = lambda x : _key_fn(x),
  top_k = config.VOCAB_SIZE

)
EN

回答 1

Stack Overflow用户

发布于 2022-11-29 11:47:53

你想达到什么目的?

我不认为key_fn是相关的,因为它只会影响词汇表的排序(提供时还会影响顶部k)。

你能在附加信息后计算词汇表吗?

tft.vocabulary(tf.strings.join([words, <mask>, <pad>]), ...)

这将导致词汇表,包括添加的后缀。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71771353

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档