搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏陶陶计算机
Tensorflow2.0实战之MNSIT数据集
最近Tensorflow相继推出了alpha和beta两个版本，这两个都属于tensorflow2.0版本；早听说新版做了很大的革新，今天就来用一下看看这里还是使用MNSIT数据集进行测试导入必要的库 import tensorflow as tf from tensorflow.keras import datasets, layers, optimizers, Sequential, metrics 数据的准备 None, 28*28)) network.summary() optimizer = optimizers.SGD(lr=0.01) acc_meter = metrics.Accuracy() 对数据集进行迭代
50930编辑于 2022-05-16
来自专栏啄木鸟软件测试
Sklean数据集（5）-波士顿房价
Environ.Economics & Management,vol.5, 81-102, 1978. 译文波士顿房价数据集 **数据集特征：** 实例数：506 属性数：13数值/分类预测。中值（属性14）通常是目标。这是UCI ML住房数据集的副本。 https://archive.ics.uci.edu/ml/machine-learning-databases/housing/ 这个数据集取自卡内基梅隆大学的StatLib图书馆大学。那个Harrison，D.和Rubinfeld，D.L.的波士顿房价数据，“享乐价格和对清洁空气的需求”，J.Environ。《经济学与管理》，第5卷，81-1021978年。
1.3K20发布于 2021-01-04
来自专栏编程杂记
YOLOv5划分数据集
数据集标注是深度学习项目中不可获取的一部分，下文从划分数据集到利用标注一条龙讲解数据集制作并标注数据集划分数据集划分 1.以YOLO为例先新建一个文件夹把数据集（图片全部放入） 2.然后新建两个文件夹分别存放数据集（images）和标签（labels） 3.概按照3：1的比例把图片划分为两个文件夹一个为训练集一个为验证集 4.然后在标签的文件夹里分别新建两个文件夹对应于图片文件夹的训练集和验证集具体文件夹关系如下
44010编辑于 2024-01-17
来自专栏云开发小程序1
YOLOV5入门讲解+常用数据集
虽然YOLOv5算法并没有与YOLOv4算法进行性能比较与分析，但是YOLOv5在COCO数据集上面的测试效果还是挺不错的。目标检测数据集 1.PASCAL VOC 2.MS COCO PASCAL VOC: PASCAL VOC挑战赛再2005年到2012年间展开。 PASCAL VOC 2007：9963张图片，24640个标注；PASCAL VOC2012：11530张图片，27450个标注，该数据集有20个分类： Person：person Animal：bird 2012 (VOC2012) MS COCO MS COCO的全称时Microsoft Common Objects in Context，起源于是微软于2014出资标注的Microsoft COCO数据集 COCO - Common Objects in Context COCO数据集包含20万个图象：11.5万多张训练集图片，5千张验证集图像，2万多张检测集图像 80个类别中有超出50万个目标标注平均每个图像的目标数为
13.6K20编辑于 2023-10-14
来自专栏一英里广度一英寸深度的学习
机器学习入门数据集--5.皮马人糖尿病预测数据集
在本项目的前期训练中，数据最后的结果都不理想。因此在代码中引入了多种数据模型：逻辑回归、高斯朴素贝叶斯、K近邻分类、决策树分类、支持向量机分类、xgboost。在训练集上，最高准确率为77%。因此在代码中引入了多种数据模型：逻辑回归、高斯朴素贝叶斯、K近邻分类、决策树分类、支持向量机分类、xgboost。在训练集上，最高准确率为77%。 wangsen/ai/13/homework/diabetes.csv") df.info() target = df.pop("Outcome") data = df.values print(data[:5] ) lr = LogisticRegression() lr.fit(data,target) score = lr.score(data,target) print("训练集上的预测准确率",score keras https://www.kesci.com/home/project/5a5b691046c4ba639c6fbfa2 多种机器学习https://blog.csdn.net/weixin
6.3K30发布于 2019-03-04
来自专栏生信技能树
了解5个乳腺癌表达数据集
最近需要学习使用genefu这个包，可以看我在生信技能树分享的韩国人的单细胞转录组乳腺癌研究文献就明白了，然后应用到自己的数据里面，发现这个包的说明书里面提到了5个乳腺癌表达数据集，安装如下： source biocLite("breastCancerUNT",ask=F,suppressUpdates=T) biocLite("breastCancerNKI",ask=F,suppressUpdates=T) 这5个数据集都是以前的研究者发表的，它们 Mainz, Transbig, UPP, and UNT 数据集分别对应的是： GSE11121,GSE7390,GSE3494,GSE2990.不过NKI数据集并没有上传在GEO里面，是从作者的补充材料里面整理的数据载入R 因为genefu这个包已经把这5个数据集处理好了，可以直接加载到R里面查看。更重要的是这 5 个数据集的临床信息，都被重新归纳总结啦： cinfo <- colnames(pData(mainz7g)) > cinfo [1] "samplename" "dataset
1.3K40发布于 2018-07-27
来自专栏应兆康的专栏
5. 开发集和测试集
你的团队下载了很多图片数据集，包含猫咪图片（正样本，positive example）和非猫咪图片（负样本， negative example）。他们将这些数据划分为70%的训练集，30%的测试集。大数据时代之前，在机器学习中人们对数据集的一个常见划分规则为：将数据集划分为70%/30%的训练集和测试集。我们通常定义： • 训练集(Training set) — 运行在算法上的数据集. • 开发集(Dev/development set) — 这部分数据通常用来调参，选择特征，以及对学习算法进行改进。换句话说，开发集和测试集的目的是为了让你对算法进行改进，使算法效果变得更好所以你应该： • 选择开发集和测试集时，主要选择可以反映未来需要获取的数据换句话说，你的测试集不应该只是可用数据的30%这么简单切记不要认为你的训练集和测试集分布必须是一样的。尽量去选择那些可以反映真实情况的数据作为测试样本。
1.2K60发布于 2018-05-09
来自专栏数据科学和人工智能
数据集 | 图书数据集
下载数据集请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息，包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源当当网搜索页面爬取。
2.9K40编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 行星数据集
下载数据集请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星（除了太阳）周围发现的行星的信息。 1. 字段描述 2. 数据预览 3. 数据来源来源于UCI机器学习库。
2.1K20编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 订购数据集
下载数据集请登录爱数科(www.idatascience.cn) 该数据集记录了一家全球超市4年的订购数据，包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1. 数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。
2.2K30编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 鲍鱼数据集
下载数据集请登录爱数科(www.idatascience.cn) 通过物理测量预测鲍鱼的年龄。从原始数据中删除了缺失值的样本，并且对连续值的范围进行了缩放。数据集共4177个样本，8个字段 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn and Wes B Ford (1994) "The Population Coast and Islands of Bass Strait",Sea Fisheries Division, Technical Report No. 48 (ISSN 1034-3288) 5. 数据引用 Nash W J, Sellers T L, Talbot S R, et al.
2.9K40编辑于 2022-03-30
来自专栏GEE数据专栏，GEE学习专栏，GEE错误集等专栏
GEE数据集——全球ERA5-HEAT（人类热舒适度）逐日数据集
简介 ERA5-HEAT数据集该数据集提供了一组代表室外条件下人类热应力和不适指数的完整历史重建。该数据集也被称为ERA5-HEAT（人类热舒适度），代表了当前生物气候学数据记录制作的最先进水平。该数据集围绕两个主要变量展开：1）平均辐射温度（MRT）；2）通用热气候指数（UTCI）。这些变量描述了人体如何体验大气条件，特别是气温、湿度、通风和辐射。该数据集是利用欧洲中期预报中心（ECMWF）的ERA5 再分析计算得出的。ERA5将模型数据与世界各地的观测数据结合在一起，对地球气候及其近几十年的演变提供了全球范围内完整一致的描述。数据集说明空间信息 Attribute Details Spatial extent Global Spatial resolution 27.75km (.25 deg) Temporal resolution -heat') var era5_heat_i = era5_heat_ic.first() // 打印第一幅图像，查看波段 print(era5_heat_i) // 可视化第一幅图像中的选定波段
83610编辑于 2024-06-01
来自专栏GEE数据专栏，GEE学习专栏，GEE错误集等专栏
GEE数据集——ERA5-陆地每日汇总--ECMWF气候再分析数据集
简介注（2024-04-19）：由于哥白尼气候数据存储的现代化工作受到影响，ECMWF 数据集的生产可能会中断。提供商未说明计划完成日期，详情请参见用户论坛。 ERA5-陆地是一个再分析数据集，以比ERA5更高的分辨率提供了几十年陆地变量演变的一致视图。 ERA5-陆地是通过重放 ECMWF ERA5 气候再分析的陆地部分而生成的。再分析利用物理定律将模式数据与世界各地的观测数据相结合，形成一个全球完整一致的数据集。再分析产生的数据可追溯到几十年前，能准确描述过去的气候。该数据集包括 CDS 上提供的全部 50 个变量，是 ECMWF ERA5 陆地小时数据的每日总和，包括流动带和非流动带。 ERA5-陆地每日汇总数据可提供从 1950 年到三个月的实时数据。更多信息，请访问哥白尼气候数据商店。降水量和其他流量（累积）带偶尔会出现负值，这在物理上是不合理的。
1.4K10编辑于 2024-10-20
来自专栏数据科学和人工智能
数据集 | 小费数据集
下载数据集请登录爱数科(www.idatascience.cn) 小费数据集 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源
1.9K20编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 广告数据集
下载数据集请登录爱数科(www.idatascience.cn) 数据集由 Jose Portilla 和 Pierian Data 为他的 Udemy 课程（Python 数据科学和机器学习训练营）创建,适合用于数据分析与逻辑回归预测。数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。
2.5K30编辑于 2022-03-30
来自专栏机器学习AI算法工程
Yolov5实现道路裂缝检测，附数据集
训练自己的数据集 1.创建dataset.yaml文件文件要满足以下格式（如下图）：下载地址（没有的不用管它）训练图片路径验证图片路径类的个数类名 ? （一般的正规数据集都自带这种格式的标签，如果没有这种格式的，需要自己编写程序转换，如果没有标签只有图片，需要自行下载标记软件，然后标记图片） 4. 序号从0开始 ? 4.选择模型推荐选择YOLOv5s，小还快。 5.开始训练如果用的是Pycharm就右键train.py文件open in terminal,输入以下代码，如果不是Pycharm，可以再cmd中，先调到train.py路径下，再运行下面语句开始训练
4.5K50发布于 2021-07-14
来自专栏往期博文
【目标检测】YOLOv5跑通VisDrone数据集
背景在YOLOv5官方的6.1版本中，我发现Data目录下多了5种数据集，包括无人机航拍数据集VisDrone和遥感数据集xView，这反映了官方也是在小目标检测中在偷偷发力。这篇博文就来记录如何用YOLOv5跑通VisDrone数据集。数据集我已上传到网盘里，有需要的读者可以进行下载： https://pan.baidu.com/s/1UNQlZGHZlAZs412tbnpAxg? pwd=8888 数据集结构数据集总共分四个文件： VisDrone2019-DET-train：训练集 VisDrone2019-DET-val：验证集 VisDrone2019-DET-test-dev 数据集处理和VOC数据集一样，VisDrone的数据标注是xml形式，需要把它转换成YOLOv5所需的txt格式在官方提供的VisDrone.yaml下方，已经提供了数据处理的脚本，以它为基础进行简单修改
4.9K40编辑于 2022-09-16
来自专栏数据科学和人工智能
数据集 | 苹果股价数据集
下载数据集请登录爱数科(www.idatascience.cn) 这个数据集涵盖了过去6年苹果公司的股价。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。
1.9K30编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 中风预测数据集
数据集下载请登录爱数科（www.idatascience.cn）根据世界卫生组织（WHO）的数据，中风是全球第二大死亡原因，约占总死亡人数的11％。该数据集用于根据输入参数（例如性别，年龄，各种疾病和吸烟状况）预测患者是否可能中风。数据中的每一行都提供有关患者的相关信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息
2.4K40编辑于 2022-03-30
来自专栏数据科学和人工智能
数据集 | 超市购物数据集
下载数据集请登录爱数科(www.idatascience.cn) 人口稠密的城市中超市数量在快速增加，市场竞争也很激烈。该数据集记录了几家超市在3个不同分店中3个月的历史销售额，包含顾客性别、商品单价、销售数量、销售日期、总收入和顾客评价等信息。预测数据分析方法很容易应用于此数据集。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源来源于Kaggle。
3.7K20编辑于 2022-03-30

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Tensorflow2.0实战之MNSIT数据集

Sklean数据集（5）-波士顿房价

YOLOv5划分数据集

YOLOV5入门讲解+常用数据集

机器学习入门数据集--5.皮马人糖尿病预测数据集

了解5个乳腺癌表达数据集

5. 开发集和测试集

数据集 | 图书数据集

数据集 | 行星数据集

数据集 | 订购数据集

数据集 | 鲍鱼数据集

GEE数据集——全球ERA5-HEAT（人类热舒适度）逐日数据集

GEE数据集——ERA5-陆地每日汇总--ECMWF气候再分析数据集

数据集 | 小费数据集

数据集 | 广告数据集

Yolov5实现道路裂缝检测，附数据集

【目标检测】YOLOv5跑通VisDrone数据集

数据集 | 苹果股价数据集

数据集 | 中风预测数据集

数据集 | 超市购物数据集

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐