首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 7-7 试手MNIST数据

    本小节使用更大更正规的手写识别数据MNIST数据,使用sklearn导入MNIST数据并使用kNN算法对MNIST数据进行分类。 原始数据。 /master/lab7/mldata/mnist-original.mat 百度网盘:https://pan.baidu.com/s/1PcEsFps6NHBRWVxBMl7SmQ 提取码:pz8t DESCR字段给出了下载数据的网站"mldata.org",如果有兴趣可以访问这个网站,看看其他的数据。 按照正常的机器学习流程,得到数据之后需要使用train_test_split方法对其进行划分,划分一定比例的训练以及测试,但是对于MNIST数据而言,已经帮我们划分好的训练和测试,我们只需要对

    2.8K10发布于 2019-11-13
  • 来自专栏paddle深度学习

    paddle深度学习7 数据的加载

    在深度学习中,数据是模型训练的基石。高质量的数据处理和准备是模型成功的关键。无论是使用经典的数据(如 MNIST、CIFAR-10),还是处理自定义数据,都需要掌握数据加载、预处理和增强的技巧。 本节将介绍如何加载常用的数据。在 PaddlePaddle 中,加载内置数据非常简单。 使用 paddle.vision.datasets 模块加载内置数据paddle.vision.datasets 模块提供了多个经典数据的接口,例如:MNIST:手写数字数据。 CIFAR10:10 类物体的彩色图像数据。CIFAR100:100 类物体的彩色图像数据。FashionMNIST:时尚物品图像数据。 这些数据可以通过简单的几行代码加载,并且支持自动下载和数据预处理。

    50810编辑于 2025-01-13
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    Landsat7_C2_SR数据(大气校正地表发射率数据

    Landsat7_C2_SR数据是经大气校正后的地表反射率数据,属于Collection2的二级数据产品,空间分辨率为30米,基于Landsat生态系统扰动自适应处理系统(LEDAPS)(版本3.4.0 2003年6月以来,因扫描线校正器(SLC)故障导致传输数据存在间隙问题 Landsat7_C2_SR数据是Landsat7卫星的一种数据产品,提供每个卫星场景的反射率值。 这个数据使用了Landsat生态系统干扰自适应处理系统(LEDAPS),对大气效应进行了校正,并考虑了地形变化。这使得对地表特性和时间变化进行更准确的分析成为可能。 这个数据可以从美国地质调查局的Earth Explorer网站免费下载。 key为LANDSAT_7/02/T1/SR的Landsat7_C2_SR类数据 * @Name : Landsat7_C2_SR_T1数据 */ //指定检索数据,可设置检索的空间和时间范围

    39010编辑于 2024-02-02
  • 来自专栏数据科学和人工智能

    数据 | 图书数据

    下载数据请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息,包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 当当网搜索页面爬取。

    3.2K40编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 行星数据

    下载数据请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星(除了太阳)周围发现的行星的信息。 1. 字段描述 2. 数据预览 3. 数据来源 来源于UCI机器学习库。

    2.3K20编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 订购数据

    下载数据请登录爱数科(www.idatascience.cn) 该数据记录了一家全球超市4年的订购数据,包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    2.4K30编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 鲍鱼数据

    下载数据请登录爱数科(www.idatascience.cn) 通过物理测量预测鲍鱼的年龄。 从原始数据中删除了缺失值的样本,并且对连续值的范围进行了缩放。数据共4177个样本,8个字段 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn and Wes B Ford (1994) "The Population 数据引用 Nash W J, Sellers T L, Talbot S R, et al.

    3.1K40编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 广告数据

    下载数据请登录爱数科(www.idatascience.cn) 数据由 Jose Portilla 和 Pierian Data 为他的 Udemy 课程(Python 数据科学和机器学习训练营) 创建,适合用于数据分析与逻辑回归预测。 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    2.7K30编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 小费数据

    下载数据请登录爱数科(www.idatascience.cn) 小费数据 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源

    2K20编辑于 2022-03-30
  • 来自专栏应兆康的专栏

    7. 开发和测试应该多大?

    7 开发和测试应该多大? 开发应该足够大,大到可以检测出不同算法之间的差异。比如:如果分类器A的精度为90.0%,分类器B精度为90.1%。 如果你的开发只有100条,那么你可能检测不出这0.1%的差异,与其它机器学习的问题相比,100条数据很小,常见的开发集数据规模在1000到10000条之间。数据量越高,模型之间的差异越明显。 在这种情况下,开发数据量可能远远超过10000条,只为了对算法进行改进。 测试要多大?它也应该足够大,大到你有一个很高自信度去对系统的整体性能进行评估。这里有一个方法:将30%的数据用于测试。 在你拥有一个中等(100到10000个样本)数据量的情况下,它的效果不错。 但是在大数据的时代下,我们面对的机器学习问题数据量可能会超过10亿条样本,开发与测试之间的比例一直在减小,但是开发与测试的绝对数量在增加。在给开发数据分配时,没必要过多的进行分配。

    91170发布于 2018-05-09
  • 对虾病害分类数据889张7类别

    数据类型:图像分类用,不可用于目标检测无标注文件 数据格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):889 分类类别数:7 类别名称:["baibanbing hongtizheng 图片数:160 huangsaizheng 图片数:97 重要说明:主要对虾是否生病进行分类判断,主要有黄鳃症、红体症、黑鳃症、黑斑病、肝萎缩、白浊病、白斑病 特别声明:本数据不对训练的模型或者权重文件精度作任何保证 ,数据只提供准确且合理分类存放 虾的图片示例(虾的具体学名叫不出来,就叫对虾吧): 下载地址: https://download.csdn.net/download/FL1623863129/89245697

    15610编辑于 2025-07-20
  • 茶叶病害分类数据6749张7类别

    数据类型:图像分类用,不可用于目标检测无标注文件 数据格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):6749 分类类别数:7 类别名称:["Unlabeled brown_blight 图片数:980 gray_blight 图片数:1000 healthy 图片数:1074 helopeltis 图片数:1000 red_spot 图片数:1143 重要说明:数据里面茶叶均为单叶 ,请仔细查看图片预览,斟酌下载 特别声明:本数据不对训练的模型或者权重文件精度作任何保证,数据只提供准确且合理分类存放 图片预览: 下载地址: https://download.csdn.net

    34710编辑于 2025-07-16
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    GEE数据更新提示——Landsat collection 1数据将被移除(截至2024年7月1日)

    今天早上接到了GEE的邮件,这次数据的更新主要是我们使用的长时间序列的遥感影像Landsat系列,之前我们所使用时间最长的Landsat C01数据,2024年7月1日将会直接熊数据集中移除。 您可能有项目在使用地球引擎数据目录中的大地遥感卫星第 1 和预采集数据,这些数据将于 2024 年 7 月 1 日移除。请迁移到集合 2,以避免请求失败。 信件内容 我们特此通知您,自 2024 年 7 月 1 日起,我们将从地球引擎数据目录中删除大地遥感卫星第 1 号采集和预采集集数据。 诸如 32 天 NDVI 等计算数据将从 Collection 2 生成。 您需要知道什么? 自 2021 年 12 月 31 日起,美国地质调查局不再制作或提供大地遥感卫星第 1 集数据。 注意:请确保在 2024 年 7 月 1 日前更新地球引擎脚本、模块和应用程序,以避免请求失败。

    41600编辑于 2024-05-24
  • 来自专栏Python和安全那些事

    7.基于机器学习的安全数据总结

    The Malware Capture Facility Project 恶意软件数据库 APT攻击数据 图像分类数据-1000 MNIST-手写数字 垃圾邮件数据 自然灾害数据 作者的github https://github.com/RedDrip7/APT_Digital_Weapon https://github.com/kbandla/APTnotes 下载推荐: https://virusshare.com (第0类)、沙滩(第1类)、建筑(第2类)、大卡车(第3类)、恐龙(第4类)、大象(第5类)、花朵(第6类)、马(第7类)、山峰(第8类)和食品(第9类),每类100张。 该数据由惠普实验室于1999年7月发布,主要发布人有Mark Hopkins、Erik Reeber、George Forman和Jaap Suermondt。另一个垃圾邮件数据是 Enron。 ,可能很多同学会受到数据的困扰,真心希望这些数据对您有所帮助,也欢迎大家继续补充新的数据

    2.8K20编辑于 2022-03-30
  • 来自专栏机器学习AI算法工程

    yolov7-pytorch可用于训练自己的数据

    向AI转型的程序员都关注了这个号 机器学习AI算法工程   公众号:datayx YOLOV7:You Only Look Once目标检测模型在pytorch当中的实现 所需环境 torch==1.2.0 全部 代码  ,预训练模型 获取方式: 关注微信公众号 datayx  然后回复 v7  即可获取。 训练步骤 a、训练VOC07+12数据 数据的准备 本文使用VOC格式进行训练,训练前需要下载好VOC07+12的数据,解压后放在根目录 数据的处理 修改voc_annotation.py里面的 b、训练自己的数据 数据的准备 本文使用VOC格式进行训练,训练前需要自己制作好数据, 训练前将标签文件放在VOCdevkit文件夹下的VOC2007文件夹下的Annotation中。 b、评估自己的数据 本文使用VOC格式进行评估。 如果在训练前已经运行过voc_annotation.py文件,代码会自动将数据划分成训练、验证和测试

    2.6K30编辑于 2022-07-26
  • 来自专栏数据科学和人工智能

    数据 | 中风预测数据

    数据下载请登录爱数科(www.idatascience.cn) 根据世界卫生组织(WHO)的数据,中风是全球第二大死亡原因,约占总死亡人数的11%。 该数据用于根据输入参数(例如性别,年龄,各种疾病和吸烟状况)预测患者是否可能中风。数据中的每一行都提供有关患者的相关信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息

    2.5K40编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 苹果股价数据

    下载数据请登录爱数科(www.idatascience.cn) 这个数据涵盖了过去6年苹果公司的股价。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    2K30编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 超市购物数据

    下载数据请登录爱数科(www.idatascience.cn) 人口稠密的城市中超市数量在快速增加,市场竞争也很激烈。 该数据记录了几家超市在3个不同分店中3个月的历史销售额,包含顾客性别、商品单价、销售数量、销售日期、总收入和顾客评价等信息。预测数据分析方法很容易应用于此数据。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    4K20编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | Udemy课程数据

    下载数据请登录爱数科(www.idatascience.cn) 该数据包含来自Udemy的4个科目(商业金融、平面设计、乐器和网页设计)的3.682条课程记录。 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。 5. 数据引用

    2.2K20编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 婚姻情况数据

    下载数据请登录爱数科(www.idatascience.cn) 某社会实验内容为男人和女人签约嫁给一个他们以前从未见过的完全陌生的人。专家根据测试和面试对夫妇进行配对。 该数据记录了十次该社会实验的数据。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    1.9K10编辑于 2022-03-30
领券