首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我们能用句子转换器嵌入没有标签的句子吗?

我们能用句子转换器嵌入没有标签的句子吗?
EN

Data Science用户
提问于 2020-08-25 14:39:45
回答 1查看 722关注 0票数 1

我试着用这个项目:

https://github.com/UKPLab/sentence-transformers

为了嵌入非英语句子,语言不是人类语言,而是机器语言(x86)。

但问题是,我找不到一个简单的例子,它展示了如何在没有任何标签或句子相似性值的情况下使用自定义数据集嵌入句子。

基本上,我有一组句子列表,没有句子的标签,也没有它们的相似值,我想把它们嵌入到向量中,以一种尽可能最好的方式保持句子的语义,到目前为止,我已经使用了使用gensim库的word2vec和doc2vec,所以我想试试这个方法,看看它是否更好?

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-08-25 15:49:31

您提供的Siamese Bert的链接是Bert或Roberta在STS或NLI数据上的一个实例。其中sentence 1的格式与sentence 2 (STS)相似,五分之三。因此,被监督,它不符合你的目的。

尽管如此,不要绝望,有些人不需要训练,尽管他们的表现可能不如受监督的人。下面使用可以在数据语料库上训练的单词嵌入来生成句子嵌入:

或者用一行一行的方式给出句子:

我没有尝试过所有的解决方案,据我所知,我建议这些方案,因为它们要么是众所周知的,要么是最近的。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/80782

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档