首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将一组单词分类为给定的标签之一

如何将一组单词分类为给定的标签之一
EN

Data Science用户
提问于 2021-05-22 16:30:48
回答 1查看 42关注 0票数 2

我有三个标签:娱乐,平静和精力充沛。我得到了这样的词集: Set1 ={云天人,植物闪光摄影,快乐短裤,草休闲娱乐} Set2 ={植物绿色,自然景观,自然环境,树枝,树木,人在自然界,树形树木,落叶}我想把这些词分类成一个标签。你们觉得怎么样?Set1应该贴上精力充沛的标签,Set2应该贴上平静的标签。

EN

回答 1

Data Science用户

回答已采纳

发布于 2021-05-23 15:55:11

可能有许多变体,但这里有两种简单的方法:

  • 使用预先训练过的单词嵌入,您可以计算两个单词之间的语义相似性。例如,您可以使用余弦度量目标词的向量(例如“冷静”)和集合中的每个单词(例如“云”)之间的相似性。然后,集合中跨单词的平均值给出集合与目标关联的程度,您可以选择具有最大相似度的目标。
  • 使用WordNet直接获取词之间的语义距离/相似度。该方法与上述方法相似。

请注意,可以对这些基本思想进行许多改进,例如,您可以使用与“冷静”相关的一组预定义的单词,而不仅仅是“冷静”(例如,您可以从WordNet获得最相似的单词)。还有许多可供选择的词集合集合。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/94784

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档