文章/答案/技术大牛

发布

社区首页 >问答首页 >如何存储词向量嵌入？

问如何存储词向量嵌入？
EN

Stack Overflow用户

提问于 2020-07-03 15:51:34

回答 1查看 2.3K关注 0票数 3

我正在使用BERT单词嵌入3个标签的句子分类任务。我正在使用谷歌Colab进行编码。我的问题是，由于我每次重启内核时都必须执行嵌入部分，有没有办法在生成后保存这些单词嵌入？因为，生成这些嵌入需要花费大量的时间。

我用来生成BERT单词嵌入的代码是-

[get_features(text_list[i]) for text_list[i] in text_list]

这里，gen_features是一个函数，它为我的列表text_list中的每个i返回单词嵌入。

我读到将嵌入转换为颠簸张量，然后使用np.save可以做到这一点。但实际上我不知道如何编码。

请帮帮忙。

python-3.x

keras

nlp

word-embedding

bert-language-model

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-07-03 16:19:06

您可以通过以下步骤将嵌入数据保存到numpy文件：

all_embeddings = here_is_your_function_return_all_data()
all_embeddings = np.array(all_embeddings)
np.save('embeddings.npy', all_embeddings)

如果您正在保存到google colab，那么您可以将其下载到您的本地计算机。当你需要它的时候，只需上传并加载它。

all_embeddings = np.load('embeddings.npy')

就这样。

顺便说一句，你也可以直接将你的文件保存到google drive。

票数 6

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/62710872

复制

相似问题

问如何存储词向量嵌入？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何存储词向量嵌入？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何存储词向量嵌入？
EN