首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Google Summer of Code: web分类数据集

Google Summer of Code: web分类数据集
EN

Stack Overflow用户
提问于 2011-03-23 00:35:36
回答 1查看 2.4K关注 0票数 2

我听说谷歌主办(或将要主办)网络分类竞赛,他们提供了一个大型的(170k+文档)网站数据集,这些网站被分成多个类别(体育、计算机、科学等)。我试着在他们的2009年到2011年的代码之夏网站上到处寻找,但没有找到任何东西。有人知道我在哪里可以得到那个数据集吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-03-23 23:04:30

我想我找到了(尽管我不确定数据是否由谷歌提供):the ECML/PKDD 2010 Discovery Challenge Data Set包含22个训练标签(即关于内容的标签)、URL和超链接、基于内容和基于链接的网页垃圾邮件功能、词频和自然语言处理功能。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5394653

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档