寻找一个资产和/或财富管理的数据集,在上面运行一些机器学习算法,有什么想法我可以得到它,尝试Kaggle和谷歌,但没有多少运气?
发布于 2019-03-02 17:27:37
为机器学习项目下载数据集的10个最佳网站
数据集是主要以数据矩阵或数据库格式存储的数据的集合。每个数据科学家都需要一个合适的数据集来创建机器学习项目。作为一名机器学习爱好者,我相信数据是机器学习项目的灵魂,因此选择正确使用的完美数据集是很重要的。这里有一些最好的网站和一些我个人最喜欢的;我经常用来下载数据集。
2018年十大DataSet门户网站
1 Kaggle数据集是我个人的最爱,也是维护最好的网站之一,拥有大量可用的数据。除了数据提供商,该网站还因许多在线数据科学和机器学习竞赛以及数据科学家和研究人员的云工作台而闻名。Kaggle已经成为数据科学中各种子主题下的一个巨大的集合体。它也是世界上最大的数据科学家在线社区。有了易于使用的搜索选项和可用的选择,它肯定会成为联盟中最好的。
2IMDB数据集可以找到与电影信息巨人IMDB (互联网电影数据库)相关的大量电影相关数据集。我们在数量和质量上都获得了最好的电影数据。它是电影推荐系统项目的最佳评级,例如:基于先前给定的用户评论的电影推荐系统和许多其他项目。
3 UCI机器学习存储库这是加州大学欧文分校于1987年创建的。它为机器相关领域的项目提供了正确的数据。它是数据库、领域理论和数据生成器的巨大集合。随着它在世界各地的学生、专业人士、教授和研究人员中的广泛流行,该知识库已经被引用了1000多次。
5开放印度政府数据平台有史以来最酷和最具交互性的网站之一是印度政府维护的数据集提供商平台。当前的数据对于数据分析和深度学习以及机器学习问题都很有用。它以其在互联网上可用的真实和高排名的数据而闻名。大部分数据与印度次大陆的人口普查和统计有关。
6 Yelp数据集Yelp是美国最大的评论网站之一。它包含了超过600万条评论,涉及数十万家餐馆和企业。它可以与推荐系统一起用于情感分析和挖掘技术。它包含评论、用户、提示、签到数据以及业务数据,以帮助从数据中获得洞察力。
7 Reddit Opendata和Datasets open data为每个人提供注释创建的数据。它提供了对reddit中各种开放数据集的访问。reddit.com/r/ datasets /为可视化和机器学习等各种主题提供了通用的数据集。
由Youtube创建的8个Youtube数据集,这是获取视频数据集的最佳位置。它由800多万个视频ID和标签组成。正如我们所知,Youtube是提供基于视频的娱乐的最好来源,在这里您可以获得大量的视频数据集。这些数据集最适合在机器学习和深度学习中创建与视频相关的项目。
9 Keel Dataset(s) KEEL dataset是一个开源数据集库,我们可以从其中下载任何列出的数据集。在半监督分类、无监督学习、回归和时间序列等主题下工作的许多机器学习研究人员都使用了龙骨数据集。
10欧盟( EU )开放数据门户欧洲联盟开放数据网站是下载与欧盟国家相关的数据集的完美网站。存储库中有大约13k个数据集,这是数据科学家最不为人所知但也是最好的可用目的地之一。
下载数据集
如果不使用高质量的数据,就不能创建机器学习项目。这些网站为我们提供免费的数据下载,用于任何个人或专业项目,也可用于研究。在web上有很多可供选择的选项;这里我列出了一些创建机器学习项目的最佳选项。
https://stackoverflow.com/questions/54951608
复制相似问题