首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >推荐算法的数据集大小

推荐算法的数据集大小
EN

Stack Overflow用户
提问于 2014-11-17 05:13:59
回答 1查看 1.1K关注 0票数 1

我正在使用weka创建推荐系统。到目前为止,我在互联网上读到的关于dataset的内容是,它应该有更多的数据供推荐才是好的。我想知道,如果我试图推荐一些我们不能拥有大量数据的东西。例如,如果希望为特定城市创建公园或医院推荐系统。它不会有超过100个条目。所以用小数据集来做可以吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-11-20 22:44:36

正如this post中所报告的,有一些指南或经验法则可以用来为模型准备足够的数据。这里的一些建议包括:

  • 至少是培训案例的六倍
  • 至少是每个类的特性数的三倍

请注意,这些只是经验法则,根据数据的复杂性,这些规则可能足够,也可能不够。根据本文概述的建议,100个案例可能就足够了,但正如Ramanan所述,更多的案例可能会更好。

希望这能帮上忙!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26965962

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档