我试着用这个项目:
https://github.com/UKPLab/sentence-transformers
为了嵌入非英语句子,语言不是人类语言,而是机器语言(x86)。
但问题是,我找不到一个简单的例子,它展示了如何在没有任何标签或句子相似性值的情况下使用自定义数据集嵌入句子。
基本上,我有一组句子列表,没有句子的标签,也没有它们的相似值,我想把它们嵌入到向量中,以一种尽可能最好的方式保持句子的语义,到目前为止,我已经使用了使用gensim库的word2vec和doc2vec,所以我想试试这个方法,看看它是否更好?
发布于 2020-08-25 15:49:31
https://datascience.stackexchange.com/questions/80782
复制相似问题