首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏陶陶计算机

    Tensorflow2.0实战之MNSIT数据

    最近Tensorflow相继推出了alpha和beta两个版本,这两个都属于tensorflow2.0版本;早听说新版做了很大的革新,今天就来用一下看看 这里还是使用MNSIT数据进行测试导入必要的库 import tensorflow as tf from tensorflow.keras import datasets, layers, optimizers, Sequential, metrics 数据的准备 None, 28*28)) network.summary() optimizer = optimizers.SGD(lr=0.01) acc_meter = metrics.Accuracy() 对数据进行迭代

    50930编辑于 2022-05-16
  • 来自专栏啄木鸟软件测试

    Sklean数据5)-波士顿房价

    Environ.Economics & Management,vol.5, 81-102, 1978. 译文 波士顿房价数据 **数据特征:** 实例数:506 属性数:13数值/分类预测。中值(属性14)通常是目标。 这是UCI ML住房数据的副本。 https://archive.ics.uci.edu/ml/machine-learning-databases/housing/ 这个数据取自卡内基梅隆大学的StatLib图书馆大学。 那个Harrison,D.和Rubinfeld,D.L.的波士顿房价数据,“享乐价格和对清洁空气的需求”,J.Environ。《经济学与管理》,第5卷,81-1021978年。

    1.3K20发布于 2021-01-04
  • 来自专栏编程杂记

    YOLOv5划分数据

    数据标注是深度学习项目中不可获取的一部分,下文从划分数据到利用标注一条龙讲解 数据制作并标注 数据划分 数据划分 1.以YOLO为例先新建一个文件夹把数据(图片全部放入) 2.然后新建两个文件夹分别存放数据 (images)和标签(labels) 3.概按照3:1的比例把图片划分为两个文件夹一个为训练一个为验证 4.然后在标签的文件夹里分别新建两个文件夹对应于图片文件夹的训练和验证 具体文件夹关系如下

    44010编辑于 2024-01-17
  • 来自专栏云开发小程序1

    YOLOV5入门讲解+常用数据

    虽然YOLOv5算法并没有与YOLOv4算法进行性能比较与分析,但是YOLOv5在COCO数据上面的测试效果还是挺不错的。 目标检测数据 1.PASCAL VOC 2.MS COCO PASCAL VOC: PASCAL VOC挑战赛再2005年到2012年间展开。 PASCAL VOC 2007:9963张图片,24640个标注;PASCAL VOC2012:11530张图片,27450个标注,该数据有20个分类: Person:person Animal:bird 2012 (VOC2012) MS COCO MS COCO的全称时Microsoft Common Objects in Context,起源于是微软于2014出资标注的Microsoft COCO数据 COCO - Common Objects in Context COCO数据包含20万个图象:11.5万多张训练图片,5千张验证图像,2万多张检测图像 80个类别中有超出50万个目标标注 平均每个图像的目标数为

    13.6K20编辑于 2023-10-14
  • 来自专栏一英里广度一英寸深度的学习

    机器学习入门数据--5.皮马人糖尿病预测数据

    在本项目的前期训练中,数据最后的结果都不理想。因此在代码中引入了多种数据模型:逻辑回归、高斯朴素贝叶斯、K近邻分类、决策树分类、支持向量机分类、xgboost。在训练上,最高准确率为77%。 因此在代码中引入了多种数据模型:逻辑回归、高斯朴素贝叶斯、K近邻分类、决策树分类、支持向量机分类、xgboost。在训练上,最高准确率为77%。 wangsen/ai/13/homework/diabetes.csv") df.info() target = df.pop("Outcome") data = df.values print(data[:5] ) lr = LogisticRegression() lr.fit(data,target) score = lr.score(data,target) print("训练上的预测准确率",score keras https://www.kesci.com/home/project/5a5b691046c4ba639c6fbfa2 多种 机器学习https://blog.csdn.net/weixin

    6.3K30发布于 2019-03-04
  • 来自专栏生信技能树

    了解5个乳腺癌表达数据

    最近需要学习使用genefu这个包,可以看我在生信技能树分享的韩国人的单细胞转录组乳腺癌研究文献就明白了,然后应用到自己的数据里面,发现这个包的说明书里面提到了5个乳腺癌表达数据,安装如下: source biocLite("breastCancerUNT",ask=F,suppressUpdates=T) biocLite("breastCancerNKI",ask=F,suppressUpdates=T) 这5数据都是以前的研究者发表的 ,它们 Mainz, Transbig, UPP, and UNT 数据 分别对应的是: GSE11121,GSE7390,GSE3494,GSE2990.不过NKI数据并没有上传在GEO里面,是从作者的补充材料里面整理的 数据载入R 因为genefu这个包已经把这5数据处理好了,可以直接加载到R里面查看。 更重要的是这 5数据的临床信息,都被重新归纳总结啦: cinfo <- colnames(pData(mainz7g)) > cinfo [1] "samplename" "dataset

    1.3K40发布于 2018-07-27
  • 来自专栏应兆康的专栏

    5. 开发和测试

    你的团队下载了很多图片数据,包含猫咪图片(正样本,positive example)和非猫咪图片(负样本, negative example)。他们将这些数据划分为70%的训练,30%的测试。 大数据时代之前,在机器学习中人们对数据的一个常见划分规则为:将数据划分为70%/30%的训练和测试。 我们通常定义: • 训练(Training set) — 运行在算法上的数据. • 开发(Dev/development set) — 这部分数据通常用来调参,选择特征,以及对学习算法进行改进。 换句话说,开发和测试的目的是为了让你对算法进行改进,使算法效果变得更好 所以你应该: • 选择开发和测试时,主要选择可以反映未来需要获取的数据 换句话说,你的测试不应该只是可用数据的30%这么简单 切记不要认为你的训练和测试分布必须是一样的。尽量去选择那些可以反映真实情况的数据作为测试样本。

    1.2K60发布于 2018-05-09
  • 来自专栏数据科学和人工智能

    数据 | 图书数据

    下载数据请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息,包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 当当网搜索页面爬取。

    2.9K40编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 行星数据

    下载数据请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星(除了太阳)周围发现的行星的信息。 1. 字段描述 2. 数据预览 3. 数据来源 来源于UCI机器学习库。

    2.1K20编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 订购数据

    下载数据请登录爱数科(www.idatascience.cn) 该数据记录了一家全球超市4年的订购数据,包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    2.2K30编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 鲍鱼数据

    下载数据请登录爱数科(www.idatascience.cn) 通过物理测量预测鲍鱼的年龄。 从原始数据中删除了缺失值的样本,并且对连续值的范围进行了缩放。数据共4177个样本,8个字段 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn and Wes B Ford (1994) "The Population Coast and Islands of Bass Strait",Sea Fisheries Division, Technical Report No. 48 (ISSN 1034-3288) 5. 数据引用 Nash W J, Sellers T L, Talbot S R, et al.

    2.9K40编辑于 2022-03-30
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    GEE数据——全球ERA5-HEAT(人类热舒适度)逐日数据

    简介 ERA5-HEAT数据数据提供了一组代表室外条件下人类热应力和不适指数的完整历史重建。该数据也被称为ERA5-HEAT(人类热舒适度),代表了当前生物气候学数据记录制作的最先进水平。 该数据围绕两个主要变量展开:1)平均辐射温度(MRT);2)通用热气候指数(UTCI)。这些变量描述了人体如何体验大气条件,特别是气温、湿度、通风和辐射。 该数据是利用欧洲中期预报中心(ECMWF)的ERA5 再分析计算得出的。ERA5将模型数据与世界各地的观测数据结合在一起,对地球气候及其近几十年的演变提供了全球范围内完整一致的描述。 数据说明 空间信息 Attribute Details Spatial extent Global Spatial resolution 27.75km (.25 deg) Temporal resolution -heat') var era5_heat_i = era5_heat_ic.first() // 打印第一幅图像,查看波段 print(era5_heat_i) // 可视化第一幅图像中的选定波段

    83610编辑于 2024-06-01
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    GEE数据——ERA5-陆地每日汇总--ECMWF气候再分析数据

    简介 注(2024-04-19): 由于哥白尼气候数据存储的现代化工作受到影响,ECMWF 数据的生产可能会中断。 提供商未说明计划完成日期,详情请参见用户论坛。 ERA5-陆地是一个再分析数据,以比ERA5更高的分辨率提供了几十年陆地变量演变的一致视图。 ERA5-陆地是通过重放 ECMWF ERA5 气候再分析的陆地部分而生成的。 再分析利用物理定律将模式数据与世界各地的观测数据相结合,形成一个全球完整一致的数据。 再分析产生的数据可追溯到几十年前,能准确描述过去的气候。 该数据包括 CDS 上提供的全部 50 个变量,是 ECMWF ERA5 陆地小时数据的每日总和,包括流动带和非流动带。 ERA5-陆地每日汇总数据可提供从 1950 年到三个月的实时数据。 更多信息,请访问哥白尼气候数据商店。 降水量和其他流量(累积)带偶尔会出现负值,这在物理上是不合理的。

    1.4K10编辑于 2024-10-20
  • 来自专栏数据科学和人工智能

    数据 | 小费数据

    下载数据请登录爱数科(www.idatascience.cn) 小费数据 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源

    1.9K20编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 广告数据

    下载数据请登录爱数科(www.idatascience.cn) 数据由 Jose Portilla 和 Pierian Data 为他的 Udemy 课程(Python 数据科学和机器学习训练营) 创建,适合用于数据分析与逻辑回归预测。 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    2.5K30编辑于 2022-03-30
  • 来自专栏机器学习AI算法工程

    Yolov5实现道路裂缝检测,附数据

    训练自己的数据 1.创建dataset.yaml文件 文件要满足以下格式(如下图): 下载地址(没有的不用管它) 训练图片路径 验证图片路径 类的个数 类名 ? (一般的正规数据都自带这种格式的标签,如果没有这种格式的,需要自己编写程序转换,如果没有标签只有图片,需要自行下载标记软件,然后标记图片) 4. 序号从0开始 ? 4.选择模型 推荐选择YOLOv5s,小还快。 5.开始训练 如果用的是Pycharm就右键train.py文件open in terminal,输入以下代码,如果不是Pycharm,可以再cmd中,先调到train.py路径下,再运行下面语句开始训练

    4.5K50发布于 2021-07-14
  • 来自专栏往期博文

    【目标检测】YOLOv5跑通VisDrone数据

    背景 在YOLOv5官方的6.1版本中,我发现Data目录下多了5数据,包括无人机航拍数据VisDrone和遥感数据xView,这反映了官方也是在小目标检测中在偷偷发力。 这篇博文就来记录如何用YOLOv5跑通VisDrone数据数据我已上传到网盘里,有需要的读者可以进行下载: https://pan.baidu.com/s/1UNQlZGHZlAZs412tbnpAxg? pwd=8888 数据集结构 数据总共分四个文件: VisDrone2019-DET-train:训练 VisDrone2019-DET-val:验证 VisDrone2019-DET-test-dev 数据处理 和VOC数据一样,VisDrone的数据标注是xml形式,需要把它转换成YOLOv5所需的txt格式 在官方提供的VisDrone.yaml下方,已经提供了数据处理的脚本,以它为基础进行简单修改

    4.9K40编辑于 2022-09-16
  • 来自专栏数据科学和人工智能

    数据 | 苹果股价数据

    下载数据请登录爱数科(www.idatascience.cn) 这个数据涵盖了过去6年苹果公司的股价。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    1.9K30编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 中风预测数据

    数据下载请登录爱数科(www.idatascience.cn) 根据世界卫生组织(WHO)的数据,中风是全球第二大死亡原因,约占总死亡人数的11%。 该数据用于根据输入参数(例如性别,年龄,各种疾病和吸烟状况)预测患者是否可能中风。数据中的每一行都提供有关患者的相关信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息

    2.4K40编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 超市购物数据

    下载数据请登录爱数科(www.idatascience.cn) 人口稠密的城市中超市数量在快速增加,市场竞争也很激烈。 该数据记录了几家超市在3个不同分店中3个月的历史销售额,包含顾客性别、商品单价、销售数量、销售日期、总收入和顾客评价等信息。预测数据分析方法很容易应用于此数据。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    3.7K20编辑于 2022-03-30
领券