首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >一种用于非监督文本聚类的嵌入句子的方法,比手套词更好?

一种用于非监督文本聚类的嵌入句子的方法,比手套词更好?
EN

Data Science用户
提问于 2020-07-17 09:14:25
回答 1查看 84关注 0票数 0

对于无监督文本聚类,关键是文本的init嵌入。

如果我们想要对文本使用深簇,那么文本的问题就是如何从深层模型中获得init嵌入。

BERT不能很好地嵌入init。

如果我们不使用深度模型,是否有更好的方法来获得比手套文字更好的嵌入?

EN

回答 1

Data Science用户

发布于 2020-07-20 08:20:57

通常,在单个句子/文档表示中组合单词向量并不能很好地工作,尽管平均嵌入已经在fastText和池在本文中中使用过。

您也可以使用自动编码器来尝试和预测单词的分布,类似于一种类似于这里的单词包方法。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/77862

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档