首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否有上下文相似性的参考数据集?

是否有上下文相似性的参考数据集?
EN

Data Science用户
提问于 2023-03-03 08:01:25
回答 1查看 29关注 0票数 3

我正在做一些关于单词嵌入的实验,试图捕捉上下文感知的相似性,例如,单词对apple - hardware在水果商店的上下文中非常不同,但在IT环境中非常相似。

我的问题是,是否存在针对此挑战的基准数据集。我一直在找,但什么也找不到。

提前谢谢。

EN

回答 1

Data Science用户

发布于 2023-03-03 18:14:48

我认为一些用于词义消歧(WSD)的数据集是一种选择。

水务署的任务是把一个歧义词分类为正确的意思。例如,“苹果”就意味着1种水果,2种是科技公司。因此,标记的数据集标识了含义的正确上下文。

我不知道任何特定的数据集,但我假设最先进的报纸提到并使用了这些数据集。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/119925

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档