搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏陶陶计算机
Tensorflow2.0实战之MNSIT数据集
最近Tensorflow相继推出了alpha和beta两个版本，这两个都属于tensorflow2.0版本；早听说新版做了很大的革新，今天就来用一下看看这里还是使用MNSIT数据集进行测试导入必要的库 import tensorflow as tf from tensorflow.keras import datasets, layers, optimizers, Sequential, metrics 数据的准备 None, 28*28)) network.summary() optimizer = optimizers.SGD(lr=0.01) acc_meter = metrics.Accuracy() 对数据集进行迭代
50930编辑于 2022-05-16
来自专栏AI机器学习与深度学习算法
机器学习入门 7-7 试手MNIST数据集
之后测试使用PCA对MNSIT数据集进行降维后应用kNN算法分类的效果。 sklearn的datasets中有一个专门的方法fetch_mldata，通过这个方法可以从一个官网上下载各式各样的机器学习数据集，传入的参数字符串"MNIST original"表示我们要下载的是MNSIT /master/lab7/mldata/mnist-original.mat 百度网盘：https://pan.baidu.com/s/1PcEsFps6NHBRWVxBMl7SmQ 提取码：pz8t 完成了这些操作就可以不用下载直接加载MNSIT数据集了。此时mnist变量得到的是一种类似字典的数据，可以通过Python操作字典的函数对其进行操作。在MNSIT数据集中，kNN算法的训练（fit）过程耗时39.6s。
2.7K10发布于 2019-11-13
来自专栏paddle深度学习
paddle深度学习7 数据集的加载
在深度学习中，数据是模型训练的基石。高质量的数据处理和准备是模型成功的关键。无论是使用经典的数据集（如 MNIST、CIFAR-10），还是处理自定义数据集，都需要掌握数据加载、预处理和增强的技巧。本节将介绍如何加载常用的数据集。在 PaddlePaddle 中，加载内置数据集非常简单。使用 paddle.vision.datasets 模块加载内置数据集paddle.vision.datasets 模块提供了多个经典数据集的接口，例如：MNIST：手写数字数据集。 CIFAR10：10 类物体的彩色图像数据集。CIFAR100：100 类物体的彩色图像数据集。FashionMNIST：时尚物品图像数据集。这些数据集可以通过简单的几行代码加载，并且支持自动下载和数据预处理。
40310编辑于 2025-01-13
来自专栏GEE数据专栏，GEE学习专栏，GEE错误集等专栏
Landsat7_C2_SR数据集（大气校正地表发射率数据集）
Landsat7_C2_SR数据集是经大气校正后的地表反射率数据，属于Collection2的二级数据产品，空间分辨率为30米，基于Landsat生态系统扰动自适应处理系统（LEDAPS）（版本3.4.0 2003年6月以来，因扫描线校正器(SLC)故障导致传输数据存在间隙问题 Landsat7_C2_SR数据集是Landsat7卫星的一种数据产品，提供每个卫星场景的反射率值。这个数据集使用了Landsat生态系统干扰自适应处理系统（LEDAPS），对大气效应进行了校正，并考虑了地形变化。这使得对地表特性和时间变化进行更准确的分析成为可能。这个数据集可以从美国地质调查局的Earth Explorer网站免费下载。 key为LANDSAT_7/02/T1/SR的Landsat7_C2_SR类数据集 * @Name : Landsat7_C2_SR_T1数据集 */ //指定检索数据集，可设置检索的空间和时间范围
33310编辑于 2024-02-02
来自专栏数据科学和人工智能
数据集 | 图书数据集
下载数据集请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息，包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源当当网搜索页面爬取。
2.9K40编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 行星数据集
下载数据集请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星（除了太阳）周围发现的行星的信息。 1. 字段描述 2. 数据预览 3. 数据来源来源于UCI机器学习库。
2.1K20编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 订购数据集
下载数据集请登录爱数科(www.idatascience.cn) 该数据集记录了一家全球超市4年的订购数据，包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1. 数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。
2.2K30编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 鲍鱼数据集
下载数据集请登录爱数科(www.idatascience.cn) 通过物理测量预测鲍鱼的年龄。从原始数据中删除了缺失值的样本，并且对连续值的范围进行了缩放。数据集共4177个样本，8个字段 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn and Wes B Ford (1994) "The Population 数据引用 Nash W J, Sellers T L, Talbot S R, et al.
2.9K40编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 小费数据集
下载数据集请登录爱数科(www.idatascience.cn) 小费数据集 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源
1.9K20编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 广告数据集
下载数据集请登录爱数科(www.idatascience.cn) 数据集由 Jose Portilla 和 Pierian Data 为他的 Udemy 课程（Python 数据科学和机器学习训练营）创建,适合用于数据分析与逻辑回归预测。数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。
2.5K30编辑于 2022-03-30
来自专栏应兆康的专栏
7. 开发集和测试集应该多大？
7 开发集和测试集应该多大？开发集应该足够大，大到可以检测出不同算法之间的差异。比如：如果分类器A的精度为90.0%，分类器B精度为90.1%。如果你的开发集只有100条，那么你可能检测不出这0.1%的差异，与其它机器学习的问题相比，100条数据很小，常见的开发集数据规模在1000到10000条之间。数据量越高，模型之间的差异越明显。在这种情况下，开发集的数据量可能远远超过10000条，只为了对算法进行改进。测试集要多大？它也应该足够大，大到你有一个很高自信度去对系统的整体性能进行评估。这里有一个方法：将30%的数据用于测试。在你拥有一个中等（100到10000个样本）数据量的情况下，它的效果不错。但是在大数据的时代下，我们面对的机器学习问题数据量可能会超过10亿条样本，开发集与测试集之间的比例一直在减小，但是开发与测试集的绝对数量在增加。在给开发集和数据集分配时，没必要过多的进行分配。
85970发布于 2018-05-09
茶叶病害分类数据集6749张7类别
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：6749 分类类别数：7 类别名称:["Unlabeled brown_blight 图片数：980 gray_blight 图片数：1000 healthy 图片数：1074 helopeltis 图片数：1000 red_spot 图片数：1143 重要说明：数据集里面茶叶均为单叶，请仔细查看图片预览，斟酌下载特别声明：本数据集不对训练的模型或者权重文件精度作任何保证，数据集只提供准确且合理分类存放图片预览：下载地址： https://download.csdn.net
27710编辑于 2025-07-16
对虾病害分类数据集889张7类别
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：889 分类类别数：7 类别名称:["baibanbing hongtizheng 图片数：160 huangsaizheng 图片数：97 重要说明：主要对虾是否生病进行分类判断，主要有黄鳃症、红体症、黑鳃症、黑斑病、肝萎缩、白浊病、白斑病特别声明：本数据集不对训练的模型或者权重文件精度作任何保证，数据集只提供准确且合理分类存放虾的图片示例（虾的具体学名叫不出来，就叫对虾吧）：下载地址： https://download.csdn.net/download/FL1623863129/89245697
11210编辑于 2025-07-20
来自专栏GEE数据专栏，GEE学习专栏，GEE错误集等专栏
GEE数据集更新提示——Landsat collection 1数据集将被移除（截至2024年7月1日）
今天早上接到了GEE的邮件，这次数据集的更新主要是我们使用的长时间序列的遥感影像Landsat系列，之前我们所使用时间最长的Landsat C01数据集，2024年7月1日将会直接熊数据集中移除。您可能有项目在使用地球引擎数据目录中的大地遥感卫星第 1 集和预采集数据集，这些数据集将于 2024 年 7 月 1 日移除。请迁移到集合 2，以避免请求失败。信件内容我们特此通知您，自 2024 年 7 月 1 日起，我们将从地球引擎数据目录中删除大地遥感卫星第 1 号采集集和预采集集数据集。诸如 32 天 NDVI 等计算数据集将从 Collection 2 生成。您需要知道什么？自 2021 年 12 月 31 日起，美国地质调查局不再制作或提供大地遥感卫星第 1 集数据。注意：请确保在 2024 年 7 月 1 日前更新地球引擎脚本、模块和应用程序，以避免请求失败。
35600编辑于 2024-05-24
来自专栏数据科学和人工智能
数据集 | 苹果股价数据集
下载数据集请登录爱数科(www.idatascience.cn) 这个数据集涵盖了过去6年苹果公司的股价。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。
1.9K30编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 中风预测数据集
数据集下载请登录爱数科（www.idatascience.cn）根据世界卫生组织（WHO）的数据，中风是全球第二大死亡原因，约占总死亡人数的11％。该数据集用于根据输入参数（例如性别，年龄，各种疾病和吸烟状况）预测患者是否可能中风。数据中的每一行都提供有关患者的相关信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息
2.4K40编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 超市购物数据集
下载数据集请登录爱数科(www.idatascience.cn) 人口稠密的城市中超市数量在快速增加，市场竞争也很激烈。该数据集记录了几家超市在3个不同分店中3个月的历史销售额，包含顾客性别、商品单价、销售数量、销售日期、总收入和顾客评价等信息。预测数据分析方法很容易应用于此数据集。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。
3.7K20编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | Udemy课程数据集
下载数据集请登录爱数科(www.idatascience.cn) 该数据集包含来自Udemy的4个科目(商业金融、平面设计、乐器和网页设计)的3.682条课程记录。数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。 5. 数据引用
2.1K20编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 婚姻情况数据集
下载数据集请登录爱数科(www.idatascience.cn) 某社会实验内容为男人和女人签约嫁给一个他们以前从未见过的完全陌生的人。专家根据测试和面试对夫妇进行配对。该数据集记录了十次该社会实验的数据。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。
1.8K10编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 北美停车数据集
下载数据集请登录爱数科(www.idatascience.cn) 本数据集包含北美2017年驾驶员在城市中寻找停车位的情况（只包含人口超过10万的城市）。可以用本数据集识别停车存在困难的区域，并辅助城市标志牌的设置。 1. 字段描述 2. 数据预览 3. 字段诊断信息
1.1K30编辑于 2022-03-30

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Tensorflow2.0实战之MNSIT数据集

机器学习入门 7-7 试手MNIST数据集

paddle深度学习7 数据集的加载

Landsat7_C2_SR数据集（大气校正地表发射率数据集）

数据集 | 图书数据集

数据集 | 行星数据集

数据集 | 订购数据集

数据集 | 鲍鱼数据集

数据集 | 小费数据集

数据集 | 广告数据集

7. 开发集和测试集应该多大？

茶叶病害分类数据集6749张7类别

对虾病害分类数据集889张7类别

GEE数据集更新提示——Landsat collection 1数据集将被移除（截至2024年7月1日）

数据集 | 苹果股价数据集

数据集 | 中风预测数据集

数据集 | 超市购物数据集

数据集 | Udemy课程数据集

数据集 | 婚姻情况数据集

数据集 | 北美停车数据集

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐