首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈开发那些事

    6-9 二叉树的遍历 (25分)

    本题要求给定二叉树的4种遍历。 函数接口定义: void InorderTraversal( BinTree BT ); void PreorderTraversal( BinTree BT ); void PostorderTraversal( BinTree BT ); void LevelorderTraversal( BinTree BT ); 其中BinTree结构定义如下: typedef struct TNode *Position; typedef Position BinTree; str

    31130编辑于 2023-02-27
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 6-9 有关梯度下降法的更多深入讨论

    本系列是《玩转机器学习教程》一个整理的视频笔记。这是梯度下降法的最后一小节,这一小节对梯度下降法做一个总结。

    1.6K00发布于 2019-11-13
  • 来自专栏张善友的专栏

    C# 2025年6-9月TIOBE排名增长及未来展望

    三、 C# 2025 年 6-9 月市场份额变化表 四、C# 在 TIOBE 榜单的关键数据演变(2019–2025) 五、 未来展望 超越 Java 的可能性:若 C# 维持当前增速,或将在 2026 总结:C# 在 2025 年 6-9 月虽经历份额增长,但凭借 9 月的逆势增长(+0.86%) 实现四个月整体份额提升,进一步逼近 Java。

    75310编辑于 2025-09-20
  • 腾讯云WorkBuddy驱动企业AI原生转型:6-9个月实现50%-80%效率提升

    6-9个月落地节奏 试点突破(1-2个月): 选定1-2个高价值场景(如财务对账),通过WorkBuddy桌面端试点,跑通流程。 模型资产: 针对特定业务(如勘探、炼化)训练轻量模型,避免通用模型陷阱。 第五章:开放兼容与全链路安全合规保障 企业在选择AI方案时,核心关注点在于数据安全、合规自主与技术绑定风险。

    40210编辑于 2026-05-28
  • 来自专栏FPGA探索者

    题解 | Verilog刷题解析及对应笔试面试注意点【6-9】(涉及==和===、for展开问题等)

    在B站【FPGA探索者】录制了试题讲解视频,本文更新了第6-9题文字解析。

    1.7K30编辑于 2022-05-26
  • 来自专栏全栈程序员必看

    训练模型还要训练吗_多模态预训练模型

    若使用已保存好的镜像reid_mgn:v1,在本机上可按如下操作训练 # 1.进入已保存环境的镜像(reid_mgn:v1(8.48G)、pytorch/pytorch:1.0.1-cuda10.0 personReID ufoym/deepo:testv1 /bin/bash (75服务器) # 2.进入到工程目录 cd /home/personReID/MGN-pytorch-master # 3.复制预训练模型到指定路径 打开另一个终端 docker ps 查看容器内镜像(找到reid_mgn:v1 前对应的数字字符串%%%%) docker stats %%%%% 实时监测内存情况 # 4.训练 (在原终端继续进行,注:demo.sh是已改好参数的) sh demo1.sh 补充: 训练前需要修改的文件及代码 1.demo.sh文件 修改data路径(把你的数据集路径添加到 –datadir)、 :需将数据集文件名由原始的Market-1501-****改为和代码匹配的Market1501 2.trainer.py 修改train、test中的epoch 3.main.py 如果是单GPU训练

    1K20编辑于 2022-11-08
  • 来自专栏学习之路

    【算法训练】:贪心(算法 & 题目训练

    在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的仅是在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优解,但对范围相当广泛的许多问题他能产生整体最优解或者是整体最优解的近似解。

    37710编辑于 2024-10-22
  • 来自专栏机器之心

    浙大团队基于ML的抗菌肽筛选模型,可识别整个肽库空间发现新药

    在收集的数据集上进行模型训练,并在独立的测试集上进行测试以验证模型性能,固定参数并上线服务器,对用户上传的多肽序列进行抗菌性识别。 2. 收集特定的类型的抗菌肽数据,训练模型。 基于大规模蛋白质预训练模型,利用抗菌肽数据进行微调,针对不同下游任务训练不同的模型。 可以看到过往工作多基于已有功能肽,通过已知肽链上的增删的小幅度修改,实现小规模的区域性搜索。 在长度为6-9的多肽上进行全局搜索 ,通过湿实验和活体实验,结果显示,筛选出的多肽的抗菌性能至少可以达到目前发现的,针对特定菌种的最好的抗菌肽的水平。 在长度为 6-9 的多肽全库上进行了测试,湿实验结果表明筛选出的抗菌肽的有效率达到了 98.2%,证明了整套模型的泛化性能。 3. 框架 提出了一个基于领域经验判断规则,使用分类、排序以及回归三大任务组成的一个全新的,基于机器学习的 pipeline (SMEP),如图 1.a 所示,并在长度为 6-9 之间的多肽全库上(约 5000

    1.4K30编辑于 2023-03-29
  • 来自专栏全栈程序员必看

    对抗训练

    对抗训练 对抗训练是防御对抗样本攻击的一种方法。将对抗样本和正常样本一起训练是一种有效的正则化,可以提高模型的准确度,同时也能有效降低对抗样本的攻击成功率。 不过这种防御也只是针对同样用来产生训练集中的对抗样本的方法。 探索网络对底层任务的理解层次,通过对抗训练减少原有独立同分布的测试集的错误率——在对抗扰动的训练集上训练网络 对抗样本的定义和产生 从2013年开始,深度学习模型在多种应用上已经能达到甚至超过人类水平

    1.1K30编辑于 2022-09-20
  • 来自专栏Timeline Sec

    渗透训练

    专项训练 SQL注入: https://github.com/Audi-1/sqli-labs XSS: https://github.com/haozi/xss-demo https://xss-game.appspot.com Tj1ngwe1/upload-labs XXE: https://github.com/c0ny1/xxe-lab SSRF: https://github.com/m6a-UdS/ssrf-lab 综合训练

    52710发布于 2019-12-17
  • 来自专栏MySQL解决方案工程师

    模型训练

    模型训练是改变词汇分布的一个更重要的方法,从零开始训练一个模型需要耗费大量的成本,对于一般用户来说是不可能完成的任务。 用户通常会使用一个已经在大规模数据上训练好的预训练模型进行进一步训练,这个预训练模型可能是在一个通用任务或数据集上训练得到的,具有对一般特征和模式的学习能力。 Fine-tuning:微调会采用预先训练的模型(例如,BERT)和带有标签的数据集对全部的参数进行调整,是经典的机器学习训练方法。 Prarm. Efficent FT:通过将一组非常小的参数隔离起来进行训练或者向模型中添加一些新参数,可以降低训练成本。 训练成本 模型训练需要耗费硬件成本,最后给出一个基于OCI的不同训练方法的硬件成本。

    98610编辑于 2024-06-14
  • 来自专栏sofu456

    gan训练

    gan对mnist数据集训练 使用非卷积神经网络,对1维数据模拟,卷积是对2维数据模拟 import torch import torchvision import /discriminator.pth') 单个图片训练(训练使用一张图片中的每个小图片) import torch from torch import nn from torch import autograd

    73631发布于 2019-07-09
  • 来自专栏用户2442861的专栏

    Tesseract:训练

    资源文件的训练 如果刚才按照建议进行过了尝试,应该能发现哪些是必要的文件,它们是: unicharset inttemp pffmtable normproto shapetable 训练的过程就是为了从训练数据中产生这些东西 数据准备 首先要准备好训练用的文本数据,根据不同的应用场景,对文本数据的要求会不一样。 项目网站上说到,每个字在训练用的数据文件中一般应该有 10 个样本,低频字也至少要有 5 个,高频的应该在 20 个以上。 不过就我目前进行的中文训练情况来看,每个字一个样本得到的结果也没有明显的差异,读者可以自行试验。 图像与BOX文件生成 有了数据文件后,我们需要用这些数据文件中的文字来生成图像,用这些图像去进行训练

    2.2K10发布于 2018-09-19
  • 来自专栏人人都是极客

    4.训练模型之准备训练数据

    终于要开始训练识别熊猫的模型了, 第一步是准备好训练数据,这里有三件事情要做: 收集一定数量的熊猫图片。 将图片中的熊猫用矩形框标注出来。 将原始图片和标注文件转换为TFRecord格式的文件。 收集熊猫图片倒不是太难,从谷歌和百度图片上收集 200 张熊猫的图片,应该足够训练一个可用的识别模型了。 最后需要将数据集切分为训练集合测试集,将图片文件打乱,然后按照 7:3 的比例进行切分: random.seed(42) random.shuffle(all_examples) 最后还需要一个 label map 文件,很简单,因为我们只有一种物体:熊猫 label_map.pbtxt: item { id: 1 name: 'panda' } 训练一个熊猫识别模型所需要的训练数据就准备完了 ,接下来开始在 GPU 主机上面开始训练

    2.4K80发布于 2018-03-16
  • 来自专栏AI

    AI训练师入行指南(四):模型训练

    现在,我们正式进入训练阶段:用特定数据集将模型从粗坯打磨成传世珍宝。 “用翡翠原石雕佛像,用和田玉刻印章——特定数据集就是AI模型的专属玉料。” 训练模型就像雕刻师根据玉料特性选择刻刀和技法,只有匹配的数据集才能让模型成为真正的“智能珍宝”。 1. 数据集的核心价值领域适配性:用医疗影像数据训练的模型,能识别癌症结节;用电商评论训练的模型,能感知用户情绪波动。 质量决定上限:标注精准的1000条数据,胜过混乱的10万条噪声数据。 训练技法则如同雕刻师的手艺:Adam优化器智能调节“刻刀力度”,3e-4学习率在收敛速度与稳定性间精准平衡,Dropout随机屏蔽神经元防止过度雕刻。 终极心法: 用torch.save()保存每个训练阶段——这是你的“时光回溯”按钮

    89010编辑于 2025-03-31
  • 来自专栏FreeBuf

    AI领域的预训练与自训练

    但谷歌最新的研究表明,在数据量足够的情况下,至少在目标检测任务上,采用自训练得到的预训练模型对检测结果的提升要显著优于监督预训练与无监督预训练模型。 01 使用监督学习获得预训练模型 作为实验,研究者首先在Imagenet上训练分类网络作为预训练模型,之后监督得到的预训练模型作为骨干网络在COCO数据集上进行训练。 不同数据增强模式下基线、监督式预训练、自训练式预训练下的目标检测结果对比 ? 不同数据增强模式下基线、监督式预训练、自训练式预训练下的目标检测结果对比 ? 统一实验条件下三种预监督方法对比 作为与监督预训练与无监督预训练的对比,对照实验表明使用自训练方法得到的预训练模型在各种数据增强模式,不同主任务训练集尺寸的情况下都能获得明显受益,且显著优于基线(不使用预训练模型 在语义分割方面,研究者也证明了自训练的预训练方式比监督式预训练可以达到更好的效果: ?

    2K10发布于 2020-11-16
  • 来自专栏AI科技评论

    训练后性能反而变差,自训练要取代预训练了吗?

    训练适用不同规模数据集和不同强度增强数据的训练; 3、自训练并且可以看作对预训练的补充,联合预训练和自训练可以获得更大的增益。 2 研究动机 作者希望能解决以下问题: 预训练训练结果有多大程度的帮助?什么情况下使用预训练是无效的? 与预训练相比,我们可以使用自训练并获得相似或更好的结果吗? 如果自训练优于预训练(暂做这样的假设),那它在多大的程度上比预训练好? 在什么情况下自训练比预训练更好? 自训练的灵活性和可扩展性如何? 3、自监督预训练 vs 自训练 有监督的 ImageNet预训练会损害最大规模数据集和高强度数据增强下的训练效果。但是自监督的预训练呢? 使用相同的ImageNet数据集,ImageNet的预训练获得+ 2.6AP的增益,预训练+联合训练再获得+ 0.7AP的增益,而预训练+联合训练+自训练则获得+ 3.3AP的增益。 ?

    1.5K10发布于 2020-07-23
  • 来自专栏机器学习算法与理论

    【计算机视觉】目标检测方法汇总

    一步步计算相似度 并且合并、剔除相似度的高的 OverFeat: 核心思想: 1) 区域提名;多尺度滑动 2) 分类和定位:CNN来做分类和预测边框位置 与AlexNet类似 1-5层特征抽取,6- 9层为分类层(分类任务) 不同的任务公用特征抽取层(1-5层),只替换6-9层。 使用简化的SPP层 RoI池化层 测试和训练不再分多步进行省去存储空间 SVD:使用SVD分解全连接层的参数矩阵,压缩为规模很小的全连接层。

    97820发布于 2018-08-02
  • 充电桩领域垂直行业大模型分布式推理与训练平台建设方案 - 慧知开源充电桩平台

    充电桩领域垂直行业大模型分布式推理与训练平台建设方案 一、平台定位与核心价值 行业首个垂直化AI平台 专为充电桩运营场景设计的分布式大模型训练与推理基础设施,实现"算力-算法-场景"三位一体闭环管理。 核心价值主张: 行业Know-How嵌入:内置充电桩运营专属特征工程与领域知识图谱 ⚡ 弹性算力供给:支持单节点→千卡集群弹性扩展(训练效率提升5-8倍) 场景化模型工厂:全生命周期管理(训练/微调 Ceph+Alluxio 10TB/s吞吐,PB级数据处理 网络架构 RDMA+RoCEv2 <2μs时延,200Gbps带宽 资源调度 Kubernetes+Volcano 支持1000+节点协同训练 技术栈全景 三、实施路径 阶段一:基础能力建设(3-6个月) 200PFlops算力集群部署 行业语料库构建(10TB清洗数据) 模型训练流水线(支持LoRA/P-Tuning) 阶段二:场景化落地(6 18-25% ↗️50% 运维效率 30min/工单 8min/工单 ↘️73% 设备利用率 68% 82% ↗️21% 用户留存率 61% 78% ↗️28% 成本优化: 算力成本↓40%(混合精度训练

    10010编辑于 2026-06-17
  • 来自专栏大师级码师

    C#常用正则表达式整理

    (d{1,2}|1dd|2[0-4]d|25[0-5])$" YYYY-MM-DD基本上把闰年和2月等的情况都考虑进去了 ^((((1[6-9]|[2-9]\d)\d{2})-(0? [1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0? [1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0? [1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))

    85020发布于 2021-10-27
领券