搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏机器学习算法与Python学习
Torch7模型训练
Torch7搭建卷积神经网络详细教程已经详细的介绍啦Module模块，这里再次基础上再给出一些上Container、 Transfer Functions Layers和 Simple Layers模块的理解并在后面给出一些简单的模型训练方法。下述程序在itorch qtconsole下运行。上一篇博文讲到Module主要有四个函数(详细见Torch7搭建卷积神经网络详细教程)，但是注意以下几点：forward函数的input必须和backward的函数的input一致，否则梯度更新会有问题上述函数的具体使用方法可以看Torch7的官方API以及帮助文档。接下来仅介绍一些模型训练所需要的关键函数。将image包导入当前运行环境，随机生成一张1通道32x32的彩色图像，如下 ? 然后，使用神经网络net的updateParameters()更新权重，该方法的输入值为学习率，即完成了训练。
1K130发布于 2018-04-08
来自专栏机器学习AI算法工程
yolov7-pytorch可用于训练自己的数据集
向AI转型的程序员都关注了这个号机器学习AI算法工程公众号：datayx YOLOV7：You Only Look Once目标检测模型在pytorch当中的实现所需环境 torch==1.2.0 全部代码 ,预训练模型获取方式：关注微信公众号 datayx 然后回复 v7 即可获取。训练步骤 a、训练VOC07+12数据集数据集的准备本文使用VOC格式进行训练，训练前需要下载好VOC07+12的数据集，解压后放在根目录数据集的处理修改voc_annotation.py里面的 b、训练自己的数据集数据集的准备本文使用VOC格式进行训练，训练前需要自己制作好数据集，训练前将标签文件放在VOCdevkit文件夹下的VOC2007文件夹下的Annotation中。 b、评估自己的数据集本文使用VOC格式进行评估。如果在训练前已经运行过voc_annotation.py文件，代码会自动将数据集划分成训练集、验证集和测试集。
2.5K30编辑于 2022-07-26
来自专栏刷题笔记
【2020HBU天梯赛训练】7-7 装睡
7-7 装睡你永远叫不醒一个装睡的人 —— 但是通过分析一个人的呼吸频率和脉搏，你可以发现谁在装睡！医生告诉我们，正常人睡眠时的呼吸频率是每分钟15-20次，脉搏是每分钟50-70次。
82130发布于 2020-06-23
来自专栏算法工程师的学习日志
Python基础训练100题-7
题目：请输入星期几的第一个字母来判断一下是星期几，如果第一个字母一样，则继续判断第二个字母。
32330编辑于 2022-07-27
来自专栏又见苍岚
PyTorch 学习 -7- 训练和评估
在前文基础上，我们已经获得了数据、张量和损失函数，本文介绍 Pytorch 的进行训练和评估的核心流程。参考深入浅出PyTorch ，系统补齐基础知识。 model.eval()是保证BN层能够用全部训练数据的均值和方差，即测试过程中要保证BN层的均值和方差不变。训练完train样本后，生成的模型model要用来测试样本。在model(test)之前，需要加上model.eval()，否则的话，有输入数据，即使不训练，它也会改变权值。训练流程数据加载我们前面在DataLoader构建完成后介绍了如何从中读取数据，在训练过程中使用类似的操作即可，区别在于此时要用for循环读取DataLoader中的全部数据。 125178716 文章链接： https://www.zywvvd.com/notes/study/deep-learning/pytorch/torch-learning/torch-learning-7/
61530编辑于 2023-07-24
来自专栏饶文津的专栏
「2017 Multi-University Training Contest 7」2017多校训练7
(r);i+=(d)) #define rep(i,l,r) for(int i=(l);i<(r);++(i)) #define add(x,y) x=(x+y)%M const ll M=1e9+7;
41720发布于 2020-06-02
来自专栏计算机视觉
训练神经网络的7个技巧
它将方差视为训练过程的函数，并在过拟合训练数据集和泛化误差之间取得平衡。在训练初期，偏差较大，因为网络输出与期望函数相差很远。方差非常小，因为数据尚未产生太大的影响。在训练后期，偏差较小，因为网络已经学到了基本函数。然而，如果训练时间太长，网络还将学到特定数据集的噪声，这称为过度训练。在这种情况下，方差将很大，因为噪声在数据集之间变化。八、技巧7：选择学习率学习率是模型权重在算法的每次迭代中更新的量。较小的学习率可能导致收敛较慢，但可能得到更好的结果，而较大的学习率可能导致更快的收敛，但可能得到不太理想的结果。首先，输入单个数据批次，并且保证这个batch数据对应的标签是正确的（如果需要标签的话）。然后，重复在这个batch数据上进行训练，直到损失函数数值达到稳定。，但是这些数据增强，带来的消耗就是训练次数的增加。
38910编辑于 2024-03-19
来自专栏人人都是极客
4.训练模型之准备训练数据
终于要开始训练识别熊猫的模型了，第一步是准备好训练数据，这里有三件事情要做：收集一定数量的熊猫图片。将图片中的熊猫用矩形框标注出来。将原始图片和标注文件转换为TFRecord格式的文件。最后需要将数据集切分为训练集合测试集，将图片文件打乱，然后按照 7：3 的比例进行切分： random.seed(42) random.shuffle(all_examples) example.features.feature['image/object/class/label'].int64_list.value, [1]) 后台回复“准备训练数据最后还需要一个 label map 文件，很简单，因为我们只有一种物体：熊猫 label_map.pbtxt: item { id: 1 name: 'panda' } 训练一个熊猫识别模型所需要的训练数据就准备完了，接下来开始在 GPU 主机上面开始训练。
2.3K80发布于 2018-03-16
来自专栏全栈程序员必看
mask rcnn训练自己的数据集_fasterrcnn训练自己的数据集
这篇博客是基于 Google Colab 的 mask rcnn 训练自己的数据集（以实例分割为例）文章中数据集的制作这部分的一些补充温馨提示：实例分割是针对同一个类别的不同个体或者不同部分之间进行区分界面左上角 File 下拉菜单中的 Stay With Images Data 选项否则生成的json会包含 Imagedata 信息（是很长的一大串加密的软链接），会占用很大的内存 1.首先要人为划分训练集和测试集 __ignore__ __background__ seedling #根据自己的实际情况更改 3.在datasets目录下新建 seed_train、 seed_val 两个文件夹分别存放的训练集和测试集图片和整合后的标签文件把整合后的标签文件剪切复制到同级目录下 seed_train_annotation.josn seed_val_annotation.json 完整代码说明：一次只能操作一个文件夹，也就是说：训练集生成需要执行一次代码
1.2K30编辑于 2022-09-23
来自专栏罗西的思考
PyTorch 分布式之弹性训练(7)---节点变化
[源码解析] PyTorch 分布式之弹性训练(7)---节点变化目录 [源码解析] PyTorch 分布式之弹性训练(7)---节点变化 0x00 摘要 0x01 变化方式 1.1 Scale-down 即对成员更改作出反应，并使用新的成员来重启所有workers，从而实现弹性训练。弹性训练系列文章如下： [源码解析] PyTorch 分布式之弹性训练(1) --- 总体思路 [源码解析] PyTorch 分布式之弹性训练(2)---启动&单节点流程 [源码解析] PyTorch 分布式之弹性训练(3)---代理 [源码解析] PyTorch 分布式之弹性训练(4)---Rendezvous 架构和逻辑 [源码解析] PyTorch 分布式之弹性训练(5)---Rendezvous 0xFF 参考 [源码解析] PyTorch 分布式之弹性训练(1) --- 总体思路 [源码解析] PyTorch 分布式之弹性训练(2)---启动&单节点流程 [源码解析] PyTorch 分布式之弹性训练
82020编辑于 2022-05-09
来自专栏Juicedata
如何借助 JuiceFS 为 AI 模型训练提速 7 倍
对于 AI 模型训练场景来说，第一个 epoch 完成之后后续的计算都可以直接从缓存中获取训练数据，极大地提升了训练效率。不论是 JuiceFS 还是 Alluxio，训练数据集都提前预热到了内存中，数据集约占用 160G 空间。当打开一个文件时（即 open() 请求），为了保证一致性[7]，JuiceFS 默认都会请求元数据引擎以获取最新的元信息。 7 倍的性能差距。总结及展望本文介绍了在 AI 模型训练中如何充分利用 JuiceFS 的特性来为训练提速，相比直接从对象存储读取数据集，通过 JuiceFS 可以带来最多 7 倍的性能提升。
1.1K20编辑于 2021-12-10
来自专栏罗西的思考
深度学习分布式训练框架 horovod (7) --- DistributedOptimizer
[源码解析] 深度学习分布式训练框架 horovod (7) --- DistributedOptimizer 目录 [源码解析] 深度学习分布式训练框架 horovod (7) --- DistributedOptimizer 前面几篇链接如下： [源码解析] 深度学习分布式训练框架 Horovod (1) --- 基础知识 [源码解析] 深度学习分布式训练框架 horovod (2) --- 从使用者角度切入 [源码解析] 模型训练的重点过程就是：前向传播和反向传播。以简单的深度神经网络为例，为了完成对损失的优化，我们把数据分成batch，不断把数据送入模型网络中进行如下迭代过程，目的是使最终优化网络达到收敛：一个batch的数据被送入网络进行前向传播，前向传播就是一系列的矩阵 Worker 在训练时候做如下操作：使用 DistributedGradientTape 封装 TF 官方的 Tape，配置 allreduce函数。读取一组训练数据。
1.7K10发布于 2021-06-29
来自专栏刷题笔记
【2020HBU天梯赛训练】7-51 分而治之
7-51 分而治之分而治之，各个击破是兵家常用的策略之一。在战争中，我们希望首先攻下敌方的部分城市，使其剩余的城市变成孤立无援，然后再分头各个击破。为此参谋部提供了若干打击方案。输入样例： 10 11 8 7 6 8 4 5 8 4 8 1 1 2 1 4 9 8 9 1 1 10 2 4 5 4 10 3 8 4 6 6 1 7 5 4 9 3 1 8 4 2 2 8 7 9 8 7 6 5 4 2 输出样例： NO YES YES NO NO 题目都没读懂，直接看的柳婼题解https://www.liuchuo.net/archives/5105 自己写的时候用数组还超时了
56340发布于 2020-06-23
来自专栏刷题笔记
【2020HBU天梯赛训练】7-27 月饼
7-27 月饼月饼是中国人在中秋佳节时吃的一种传统食品，不同地区有许多不同风味的月饼。现给定所有种类月饼的库存量、总售价、以及市场的最大需求量，请你计算可以获得的最大收益是多少。
54420发布于 2020-06-23
来自专栏刷题笔记
【2020HBU天梯赛训练】7-50 部落
7-50 部落 7-31 家庭房产并查集【2020HBU天梯赛训练】7-31 家庭房产 2020年2月1日11:32:45 并查集合并是改变根节点的父亲 7-34 排座位并查集【2020HBU天梯赛训练】7-34 排座位 2020年1月31日18:46:30 复习并查集 7-50 部落并查集 2020年2月12日10:33:09 犯了7-34排座位相同错误在一个社区里，每个人都有自己的小圈子输入样例： 4 3 10 1 2 2 3 4 4 1 5 7 8 3 9 6 4 2 10 5 3 7 输出样例： 10 2 Y N 犯了相同错误和家庭房产题目一样两个集合联合的时候应该修改根父亲的父亲
55620发布于 2020-06-23
来自专栏刷题笔记
【2020HBU天梯赛训练】7-43 人以群分
7-43 人以群分社交网络中我们给每个人定义了一个“活跃度”，现希望根据这个指标把人群分为两大类，即外向型（outgoing，即活跃度高的）和内向型（introverted，即活跃度低的）。 Introverted #: 5 Diff = 3611 输入样例2： 13 110 79 218 69 3721 100 29 135 2 6 13 5188 85 输出样例2： Outgoing #: 7
40930发布于 2020-06-23
来自专栏刷题笔记
【2020HBU天梯赛训练】7-11 打折
7-11 打折去商场淘打折商品时，计算打折以后的价钱是件颇费脑子的事情。例如原价￥988，标明打 7 折，则折扣价应该是￥988 x 70% = ￥691.60。输入样例： 988 7 输出样例： 691.60 啥也不说了，直接输出就完了唯一考点就是格式保留两位小数补0.
93720发布于 2020-06-23
来自专栏刷题笔记
【2020HBU天梯赛训练】7-4 稳赢
7-4 稳赢大家应该都会玩“锤子剪刀布”的游戏：两人同时给出手势，胜负规则如图所示： ? 现要求你编写一个稳赢不输的程序，根据对方的出招，给出对应的赢招。但是！
48510发布于 2020-06-23
来自专栏深度学习与计算机视觉
TensorFlow 组合训练数据（batching）
Image和Label作为训练数据提供给网络模型使用，而在实际的网络训练过程中，往往不是使用单个数据提供给模型训练，而是使用一个数据集（mini-batch），mini-batch中的数据个数称为batch-size 大部分的内容和之前的操作是相同的，数据队列中存放的还是单个的数据和标签，只是在最后的部分将出队的数据组合成为batch使用，下面给出从原始数据到batch的整个流程： ? +3*batch_size 我是这样理解第二个队列的：入队的数据就是解析出来的单个的数据，而出队的数据组合成了batch，一般来说入队数据和出队数组应该是相同的，但是在第二个队列中不是这样。他们唯一的区别是是否将数据顺序打乱。，该代码主要做以下工作，从TFRecord中读取单个数据，每四个数据组成一个batch，一共生成10个batch，将40张图片写入指定路径下，命名规则为batch?
2.3K70发布于 2018-01-02
来自专栏机器之心
7 Papers | Transformer研究井喷式涌现；最大中文多模态预训练数据集
最近出现了一种研究趋势，将这一成功扩展至了使用图神经网络（GNN）的图数据上。在本文中，来自德州农工大学和亚马逊的几位研究者对使用 SSL 来训练 GNN 的不同方法进行了回顾。具体而言，他们提出了一种被称为 M6 的跨模态预训练方法，将多模态转换为多模态多任务 Mega-transformer，以便对单模态和多模态的数据进行统一的预训练。预训练数据集统计。 ? M6 语料库中多模态数据的示例。 ? M6 预训练任务的流程。推荐：规模最大的中文多模态预训练数据集。论文 7：Self-supervised Pretraining of Visual Features in the Wild 作者：Priya Goyal、Mathilde Caron、Benjamin 在精心制作的数据上与弱监督预训练模型的对比。
95110发布于 2021-03-14

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Torch7模型训练

yolov7-pytorch可用于训练自己的数据集

【2020HBU天梯赛训练】7-7 装睡

Python基础训练100题-7

PyTorch 学习 -7- 训练和评估

「2017 Multi-University Training Contest 7」2017多校训练7

训练神经网络的7个技巧

4.训练模型之准备训练数据

mask rcnn训练自己的数据集_fasterrcnn训练自己的数据集

PyTorch 分布式之弹性训练(7)---节点变化

如何借助 JuiceFS 为 AI 模型训练提速 7 倍

深度学习分布式训练框架 horovod (7) --- DistributedOptimizer

【2020HBU天梯赛训练】7-51 分而治之

【2020HBU天梯赛训练】7-27 月饼

【2020HBU天梯赛训练】7-50 部落

【2020HBU天梯赛训练】7-43 人以群分

【2020HBU天梯赛训练】7-11 打折

【2020HBU天梯赛训练】7-4 稳赢

TensorFlow 组合训练数据（batching）

7 Papers | Transformer研究井喷式涌现；最大中文多模态预训练数据集

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐