首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >文本信息检索结果分析数据集(文本)

文本信息检索结果分析数据集(文本)
EN

Stack Overflow用户
提问于 2016-11-21 16:03:29
回答 1查看 82关注 0票数 3

我创建了文本语义搜索引擎。然而,我找不到被标记的数据集,以便我可以评估我的系统的信息检索。

是否有任何已标注的公共可用文档(文本)。因为我需要文本文档来评估信息检索结果。(召回、精度、F1值...)

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2016-11-23 07:14:56

我是朝这个方向做研究的。在我的所有研究中,我使用了AOL dataset,它由三个月(2006年3月1日至2006年5月31日)从约650k用户收集的约2000万个web查询组成。数据按匿名用户ID排序,并按顺序排列。

数据集包括{AnonID, Query, QueryTime, ItemRank, ClickURL}。更多细节可以在上面提到的链接中找到。我很想知道你是如何实现的,如果可能的话,分享你的引擎代码。我也有兴趣了解AOL数据集在您的搜索引擎中的性能。

您可以在我的git repository中找到该数据集。谢谢!

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40715354

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档