搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

腾讯词向量有开放新增词向量的接口吗？

行业、接口、腾讯

腾讯词向量有开放新增词向量的接口吗？用来补充行业特殊名称的词向量

浏览 535提问于2020-07-09

3回答

词向量到句子向量

如何利用句子中单词的向量来得到句子的向量。我曾经使用过这样的策略，比如-平均单个单词向量，或者TF-下手加权组合。这些黑客行得通，但也存在明显的问题。想知道做这件事的其他方法

浏览 0提问于2018-08-26得票数 3

1回答

我正在使用BERT单词嵌入3个标签的句子分类任务。我正在使用谷歌Colab进行编码。我的问题是，由于我每次重启内核时都必须执行嵌入部分，有没有办法在生成后保存这些单词嵌入？因为，生成这些嵌入需要花费大量的时间。我用来生成BERT单词嵌入的代码是- [get_features(text_list[i]) for text_list[i] in text_list] 这里，gen_features是一个函数，它为我的列表text_list中的每个i返回单词嵌入。我读到将嵌入转换为颠簸张量，然后使用np.save可以做到这一点。但实际上我不知道如何编码。请帮帮忙。

浏览 33提问于2020-07-03得票数 3

回答已采纳

2回答

如何微调空间词向量

因为我有很多特定于领域的单词，所以我想在一个包含我的领域特定词汇表的小数据集上微调我的向量。我的想法是用我的数据重新训练空间模型。但是，由于spacy中的单词向量是内置的，我不知道如何做到这一点。

浏览 3提问于2020-08-06得票数 0

回答已采纳

2回答

什么是词向量维度

我目前是一个深度学习的业余爱好者，在这个网站上读到了关于word2vector的文章对于CBOW或skipgram模型，我可以看到单词向量的维度是300，词汇表大小是15000。我在之前的文章中读到，我们可以对向量中的单词进行硬编码。所以我猜单词向量维度应该等于词汇表大小，或者换一种方式，这个单词维度是什么，以及如何可视化它。你怎么看待这个维度呢？

浏览 5修改于2016-07-02得票数 4

1回答

词向量和段落向量查询

在Gensim的实现中，我试图理解word2vec和doc2vec向量之间的关系。在我的应用程序中，我用相同的标签(主题)标记多个文档，我正在使用dbow_words=1在我的语料库上训练一个dbow_words=1模型，以训练单词向量。我已经能够以这种方式获得单词和文档向量之间的相似之处，这对ex来说是非常有意义的。假设在相同维数(d = 200)的同一语料库上训练时，单词向量和文档向量总是可以被比较，以便为文档标签找到相似的词或为一个词找到类似的文档标签。任何建议&

浏览 1提问于2016-11-07得票数 0

回答已采纳

1回答

Gensim Word2vec冻结某些词向量并更新其他词向量

关于gensim的word2vec，假设你已经在一个大型语料库上训练了一个模型，并且你想用新句子中的新词来更新它，但不想更新已经有向量的词。在调用model.train时，有没有可能冻结一些单词的向量，只更新一些选定的单词(比如新单词)？或许有什么诀窍可以做到呢？谢谢。

浏览 0提问于2018-07-02得票数 0

0回答

腾讯词向量相似词相似度不高？

腾讯

利用腾讯词向量，做余弦相似度，为什么“广角行车记录仪”与“行车记录仪”的相似度还没有与 “家用音响设备”的相似度高？

浏览 679提问于2019-04-16

1回答

基于词向量的文档分类

由于word2vec和glove等在分布式空间中将单词向量化，我想知道是否有任何方法推荐或常用使用word向量的文档矢量化。。因此，我想知道其他人是如何将单词向量应用于具有稳定大小的应用程序的。如果还能提供文件，那就太好了。谢谢!

浏览 1提问于2018-05-08得票数 2

回答已采纳

2回答

求词向量矩阵中最相似的词

因此，我使用keras手工计算了一个字向量矩阵，如下所示：movie.我现在想要的是得到与给定输入词最相似的

浏览 7提问于2022-07-14得票数 1

回答已采纳

4回答

Lucene 4.0中的词向量频率

我正在从Lucene 3.6升级到Lucene 4.0-beta。在Lucene3.x中，IndexReader包含一个IndexReader.getTermFreqVectors()方法，我可以使用它来提取给定文档和字段中每个术语的频率。

浏览 0修改于2012-08-24得票数 9

1回答

空间中的词向量示例问题

from spacy.en import Englishfrom numpy.linalg import norm nasa = parser.vocab['NASA'] cosine = lambda v1, v2: dot(v1, v2) / (norm(v1) * norm(v2)) # gather all known

浏览 13修改于2016-11-09得票数 3

回答已采纳

1回答

将词向量从tensorflow导入gensim

我想导入从tensorflow创建的word向量，并在gensim中使用它。

浏览 6提问于2017-06-05得票数 1

回答已采纳

1回答

混合词向量的多项grep函数

数据集中有一个包含多个单词的向量。本质上，我想要做的是创建一个函数(可能是闪亮的)，在这里我可以输入多个单词，这将从向量中提取行进行分析。用grep函数可以做到这一点吗？上面的函数工作得很好，但只有一个词。谢谢。

浏览 3修改于2020-08-05得票数 0

回答已采纳

1回答

词嵌入/词向量是如何工作/创建的？

word2vec是如何为单词创建向量的？我使用两个不同的文件(来自公共爬虫网站)训练了两个word2vec模型，但我从这两个模型获得了相同的单词向量。如何从所有这些模型中选择最好的模型，以及为什么我要为不同的模型获得相同的单词向量？对不起，如果问题不清楚的话。

浏览 2提问于2017-09-06得票数 2

回答已采纳

1回答

自然语言处理中的词向量化

词袋，word2wec，tf-idf词袋，word2wec，tf-idf是对句子中的单词进行向量化的过程。但是我没有句子。我只想说几句话。那么我该如何实现向量化单词的过程呢？

浏览 1提问于2019-03-20得票数 0

1回答

相似文本分类问题(词向量、句子向量)

tf.convert_to_tensor(sentences_padded, tf.float32, name='t')我的下一个想法是用循环把句子的单词向量加起来，得到“句子向量”。然后用循环来找出向量的余弦相似性，相似度越近，就越接近。所以，如果我需要把句子中的单词向量加起来才能得到句子向量，那是不是把太多无效的向量加进去了呢？我也不知道如何去除这个无效的向量。另外，我也不知

浏览 3提问于2020-11-08得票数 0

2回答

CBOW与跳格词向量的区别

我经历过几个链接，但不能够理解CBOW and Skip Gram是如何从零开始训练的？Word2Vec - CBOW和Skip-克Example or Application where CBOW would be preferable choice but not Skip-gram and vice versa.

浏览 0提问于2020-10-12得票数 1

2回答

词嵌入和词向量化的确切区别是什么？

我试图找出词嵌入和词向量化之间的确切区别。然而，似乎有些文章交替使用这些词。但我认为一定有不同之处。在矢量化中，我偶然发现了这些矢量器：而且，当我试图理解嵌入这个词的时候。我找到了这些工具。单词袋，Word2Vec 请你简要地总结一下词嵌入和词向量化的区别和算法。非常感谢。

浏览 0提问于2022-03-13得票数 4

回答已采纳

1回答

子词向量到由Sentenc尖顶符号标记的字向量

因此，他们给出了不存在于词汇表中的未知单词的子词向量。但是我想得到每个单词的单词向量，比如Word2vec，fastText。我应该平均子词向量来表示单词向量吗？

浏览 2提问于2020-03-17得票数 2

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

腾讯词向量有开放新增词向量的接口吗？

词向量到句子向量

如何存储词向量嵌入？

如何微调空间词向量

什么是词向量维度

词向量和段落向量查询

Gensim Word2vec冻结某些词向量并更新其他词向量

腾讯词向量相似词相似度不高？

基于词向量的文档分类

求词向量矩阵中最相似的词

Lucene 4.0中的词向量频率

空间中的词向量示例问题

将词向量从tensorflow导入gensim

混合词向量的多项grep函数

词嵌入/词向量是如何工作/创建的？

自然语言处理中的词向量化

相似文本分类问题(词向量、句子向量)

CBOW与跳格词向量的区别

词嵌入和词向量化的确切区别是什么？

子词向量到由Sentenc尖顶符号标记的字向量

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐