首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >word2vec输出后的模型

word2vec输出后的模型
EN

Data Science用户
提问于 2019-09-02 16:45:03
回答 1查看 78关注 0票数 0

我最初是使用一个包字(2克)模型来处理一个分类问题。将2克输出的热编码发送到logistic回归或神经网络建立分类模型。

现在,我正在实验gensim word2vec方法,每个单词现在都是来自word2vec的向量。也就是说,如果我的句子有10个单词,它就会变成一个10x30数组(假设word2vec嵌入维数是30)。我不清楚如何像以前那样把这样的输出发送给逻辑回归或神经网络模型。

在gensim word2vec输出之后,我应该使用哪种类型的模型来解决分类问题?谢谢!

EN

回答 1

Data Science用户

发布于 2019-09-02 18:28:13

有多种方法,每种方法都包括总结文档中每个单词的嵌入。

在使用像Logistic回归这样的线性模型时,最常见的情况是:

  • 最大字向量
  • 字向量均值
  • 字向量的串联(但意味着固定长度)

然而,重要的是,使用这种方法往往会导致:

  • 与使用“一字不差”相比,表现要么相同,要么更差。
  • 较少的可解释性(如适用)

原因是信息的丢失(尤其是长文档)。

当使用word嵌入(也就是所谓的word2vec)时,最好的选择通常是使用能够在输入中处理第二个维度的模型。

因此,递归和卷积神经网络已经证明是有效的。前者通过递归地输入单词嵌入在单词级别操作,后者在整个文档级别(如您所提到的n_{words}\times d_{embedding}矩阵所表示)通过带有文档窗口的局部卷积过滤器来操作。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/58560

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档