首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏月梦·剑心的技术专栏

    层.最大

    层,有核类似于卷积核。最常使用的操作时最大,最大操作是选择核所覆盖的网格中最大的数作为输出。 层的作用是保留输入特征同时把数据量减小 写一个仅有层的神经网络作为测试,体验层的作用 import torch from torch import nn #设置输入数据,5*5矩阵 input [5,2,3,1,1], [2,1,0,1,1]],dtype=torch.float32) #变换输入数据使得输入符合层要求的格式 #-1batch_size __init__() #构建层 self.pooling=torch.nn.MaxPool2d(3,ceil_mode=True) #前向传播函数 def ;stride参数默认值为核的大小。

    72530编辑于 2022-09-14
  • 来自专栏代码编写世界

    Unity3D学习笔记8——GPU实例(3)

    自动实例 2.2. MaterialPropertyBlock 3. 参考 1. 概述 在前两篇文章《Unity3D学习笔记6——GPU实例(1)》《Unity3D学习笔记6——GPU实例(2)》分别介绍了通过简单的顶点着色器+片元着色器,以及通过表面着色器实现GPU实例的过程 自动实例 一个有意思的地方在于,Unity提供的标准材质支持自动实例,而不用像《Unity3D学习笔记6——GPU实例(1)》《Unity3D学习笔记6——GPU实例(2)》那样额外编写脚本和Shader 与《Unity3D学习笔记6——GPU实例(1)》《Unity3D学习笔记6——GPU实例(2)》提到的通过底层接口Graphic进行实例绘制相比,效率还是要低一些。 2.2. 参考 《Unity3D学习笔记6——GPU实例(1)》 《Unity3D学习笔记6——GPU实例(2)》 Creating shaders that support GPU instancing MaterialPropertyBlock

    1.7K10编辑于 2022-07-12
  • 来自专栏运维开发故事

    开发 Operator 调度 GPU 实例资源

    本文我们将自己开发一个 Operator 来维护 GPU 资源的稳定,解决 AI 模型训练的基础平台的稳定性。 其架构如下: ee11ee9bb3ba2f232c0f78573956823f MD5 其中: GPU 资源采用的是腾讯云的竞价 GPU 实例 Operator 运行在 K8s 中,通过 SpootPool 控制 GPU 资源的数量 若云平台释放了某台 GPU 实例,当 Operator 监听到资源数量和期望的不匹配,会自动补充到期望数量 Operator 的开发有多种脚手架,常用的有 operator-sdk 资源的自动管理。 Operator 是云原生时代自动运维的重要利器。掌握其开发方法,意味着我们不仅能“用好” Kubernetes,更能“扩展” Kubernetes,为复杂业务场景提供定制的解决方案。

    35210编辑于 2025-09-04
  • 来自专栏存储公众号:王知鱼

    基于CXL™-Type3 实现内存

    更优解可能是围绕数据本身的GPU(TPU)+DPU方案,在这个体系里,就内存带宽而言,较CPU方案内存带宽大幅提升。 62GB/s,内存大小与DRAM相当,或更大。 围绕GPU/TPU: • HBM, 当前最先进的是HBM3(HBM3e 恺侠等厂商24年下半年量产),带宽较远超同代DDR(一说3.58TB/s),内存容量相对较小,CXL亦可扩展数据密集型场景的内存 CXL 联盟定义了3种CXL设备的概念设计,分别是: • type1 连接交换机的专用加速网卡 • type2 数据密集型的GPU、FPGA加速卡 • type3 内存Cache 从场景落地远-近程度 ,type3 Memory缓存,是缓解当前CPU闲置率较高,加速AI 训练、推理的重点关注对象。

    1.5K20编辑于 2025-02-11
  • 来自专栏全栈程序员必看

    选择】全局最大和全局平均的实验分析

    Learning Deep Features for Discriminative Localization论文中的描述,在使用类响应图class activation mapping (CAM) 对比全局平均 Global average pooling (GAP) vs 全局最大global max pooling (GMP): 类响应图示例: 图中高亮区域就是根据label的注意图高响应区域 具体得到的这个相应区的方法是 1) 训练主干网络得到特征图 2) 进行全局(图中用的GAP,也可以使用GMP) 3) 对全局的结果做全连接得到全连接参数 w 4) 把全连接参数作为权重对特征图进行加权求和

    2.6K40编辑于 2022-07-25
  • 来自专栏代码编写世界

    Unity3D学习笔记7——GPU实例(2)

    解析 3. 参考 1. 概述 在上一篇文章《Unity3D学习笔记6——GPU实例(1)》详细介绍了Unity3d中GPU实例的实现,并且给出了详细代码。 Unity提供的很多着色器是表面着色器,通过表面着色器,也是可以实现GPU实例的。 2. 详论 2.1. 这样的关键字,可以编译实例的着色器版本。 正如上一篇文章所言,GPU实例的关键就在于模型矩阵的重新计算。在Unity API官方示例中,还修改了其逆矩阵unity_WorldToObject。 3. 参考 《Unity3D学习笔记6——GPU实例(1)》 Graphics.DrawMeshInstancedIndirect Declaring and using shader keywords in

    84520编辑于 2022-07-12
  • 来自专栏用户5325874的专栏

    技术

    技术 概念 技术:把一些能够复用的东西(比如说数据库连接、线程)放到池中,避免重复创建、销毁的开销,从而极大提高性能。 目前 C3P0 连接可以采用这种方式来检测连接是否可用,也是我比较推荐的方式。 在获取到连接之后,先校验连接是否可用,如果可用才会执行 SQL 语句。 可这些缺陷相比技术的优势来说就比较微不足道了,只要我们确认要使用的对象在创建时确实比较耗时或者消耗资源,并且这些对象也确实会被频繁地创建和销毁,我们就可以使用技术来优化。 池子中的对象需要在使用之前预先初始完成,这叫做池子的预热,比方说使用线程时就需要预先初始所有的核心线程。如果池子未经过预热可能会导致系统重启后产生比较多的慢请求。 技术核心是一种空间换时间优化方法的实践,所以要关注空间占用情况,避免出现空间过度使用出现内存泄露或者频繁垃圾回收等问题。 参考 技术

    1.4K40发布于 2020-04-13
  • 来自专栏代码编写世界

    Unity3D学习笔记6——GPU实例(1)

    一个合理的策略就是,我们指定一个需要绘制物体对象,以及大量该对象不同的参数,然后根据参数在一个绘制调用中绘制出来——这就是所谓的GPU实例。 2. ,渲染这个网格的多个实例: GPU实例的关键接口是Graphics.DrawMeshInstancedIndirect()。 实例参数InstanceParam和GPU缓冲区参数bufferWithArgs都是存储于一个ComputeBuffer对象中。 学习笔记3——Unity Shader的初步使用》的简单实例着色器。 3. 参考 《Unity3D学习笔记3——Unity Shader的初步使用》 Graphics.DrawMeshInstanced 具体实现代码

    1.5K10编辑于 2022-07-12
  • 来自专栏全栈程序员必看

    卷积、反卷积、、反「建议收藏」

    三、 的定义比较简单,最直观的作用便是降维,常见的有最大、平均和随机层不需要训练参数。 1、三种示意图 最大是对局部的值取最大;平均是对局部的值取平均;随机是根据概率对局部的值进行采样,采样结果便是结果。 (2)平均往往能保留整体数据的特征,能凸出背景的信息。 (3)随机中元素值大的被选中的概率也大,但不是像最大总是取最大值。 3、重叠 一般在CNN中使用的都是不重叠的,但是也可以重叠,重叠和卷积操作类似,可以定义步长等参数,其和卷积的不同在于:卷积操作将窗口元素和卷积核求内积,而操作求最大值/平均值等,窗口的滑动等原理完全相同 四、反 操作中最常见的最大和平均,因此最常见的反操作有反最大和反平均,其示意图如下: 反最大需要记录化时最大值的位置,反平均不需要此过程。

    5.2K22编辑于 2022-08-31
  • 来自专栏全栈程序员必看

    全局平均层替代全连接层(最大和平均的区别)

    最近看了两张图,我对第一张图有些不同的见解。首先全连接层和softmax层是不同的两个部分,其次计算参数时候可以理解为,假设最后一个卷积层是4个4*4的特征图,类别为4,则计算量为4*4*4*4。同样去理解GAP,为4*4,而这里与softmax还没有关系。

    1.3K40编辑于 2022-07-31
  • 来自专栏Android菜鸟成长记录

    浅谈技术

    前言 在编程学习中我们经常听到各种各样的技术,如线程、连接、对象和缓存等,平时我们背八股都是背诵里面的技术,但少有人去了解什么是技术,这些技术为什么要带个"",本文主要介绍一下什么是技术 二、为什么要使用技术? 资源节约 技术可以显著减少资源的浪费。在没有的情况下,我们可能会不断地创建新的资源实例,例如线程或数据库连接,使用完毕后再将它们销毁。 三、技术的应用场景 技术在编程中的应用场景非常广泛,它们可以帮助我们更有效地管理各种资源,从而提高系统的性能和效率。以下是四种常见的技术以及它们在不同编程场景中的详细解释: 1. 连接在应用程序初始化时创建一组数据库连接,并在需要时将连接提供给应用程序。这消除了频繁创建和销毁连接的开销,减少了数据库访问的延迟。 3. 通过学习和应用技术,我们可以获得以下几方面的收获: 资源管理技能 技术的核心思想是有效地管理资源。通过学习技术,我们可以掌握资源管理的基本原则,包括资源的创建、分配、重用和回收。

    1.4K10编辑于 2023-11-22
  • 来自专栏分享技术

    什么是

    思想对于 JAVA 是意义非凡的,因为其避免了很多的创建开销。 线程资源,数据库连接资源,TCP连接等,这些对象的初始,通常是要花费较长时间的,如果我们频繁的进行申请和销毁,就会消耗大量的系统资源,进而对性能造成影像。 于此同时这些对象又有一个共性的特征,就是如果他们是可以的,通过创建一个虚拟的,将这些资源预存起来,当我们需要的时候,从中按需获取,就可以了。 数据库连接先从数据库连接讲起吧,其基本思路就是在系统初始的时候,就把数据库连接作为对象储存起来,放在内存中,当用户需要在访问数据库的时候,我们不创建新的连接,而是从连接汇中获取一个已经创建好的空闲的连接对象 在使用完后,也不关闭,物归原主,依旧放进连接,以供之后使用。这些连接的行为都由连接来管理。任务的管理就需要我们通过参数来调整了。

    42620编辑于 2023-11-09
  • 来自专栏亨利笔记

    一文了解 TKG 如何使用 GPU 资源

    ,细粒度,快速交付切分 GPU 算力需求,急需经济高效 GPU 算力方案。 VMware 作为虚拟与云原生技术的领导者,在 GPU 算力资源领域也是一直处于领先地位,针对不同使用场景有对应的 GPU 资源方案。 GPU 算力方式 优点 缺点 备注 GPU直通方式 GPU独占模式,运算功能强 GPU资源浪费;不支持共享GPU资源;不支持vMotion 支持虚拟机,vsphere with Tanzu方案 vGPU 方式 GPU共享;支持vMotion,挂起/恢复 GPU配置文件固定;资源分配静态;需要购买vGPU License 支持虚拟机,vSphere with Tanzu方案 Bitfusion GPU方式 ,本文重点介绍 VMware vSphere Bitfusion GPU方案。

    2K50编辑于 2023-04-04
  • 来自专栏虚拟化云计算

    GPU虚拟哪家强

    2014年之前GPU虚拟技术一直采用的是GPU直接passthrough技术,它分为GPU直接passthrough和使用VFIO的passthrough,后来出现了基于SRIOV的GPU虚拟方案( AMD的GPU采用这种方案)和GPU分片虚拟(mdev)的GPU虚拟方案(Intel和NVDIA采用这种方案) Intel的GPU虚拟技术叫做GVT-g,NVDIA的GPU虚拟技术叫做GRID 现在Intel和NVIDIA的GPU虚拟方案都是采用的VFIO mediated passthrough framework。 GPU直接passthrough以及AMD采用的SRIOV方式下,IOMMU是必备组件,直接使用IOMMU硬件完成GFN到PFN的地址转换。 而VFIO mediated passthrough可以通过Host端对vGPU性能指标进行监控,因为VM对GPU的访问要绕道Host端。

    3.3K20发布于 2020-09-01
  • 来自专栏机器学习、深度学习

    随机采样--S3Pool: Pooling with Stochastic Spatial Sampling

    S3Pool: Pooling with Stochastic Spatial Sampling CVPR2017 https://github.com/Shuangfei/s3pool 本文将常规看作两个步骤 : 1)以步长为1在特征图上滑动窗口,尺寸大小基本保持不变, leaves the spatial resolution intact 2)以一种 uniform 和 deterministic implicit data augmentation by introducing distortions in the feature maps Stochastic pooling 可以看作在一个窗口内 对特征图数值进行归一, 按照特征图归一后的 概率值大小随机采样选择,即元素值大的被选中的概率也大 ? generalization ability, which can be adjusted in different applications by setting the grid sizes of each S3Pool

    1.5K20发布于 2019-05-26
  • 来自专栏轻量级微服务

    容器 TensorFlow GPU 环境搭建

    (uname -r) 重启机器后,再次验证系统是否使用 nouveau lsmod | grep nouveau 如果还是不行,可以尝试执行 sudo dracut --force 后重启机器 3、 NVIDIA-Linux-x86_64-415.18.run --no-opengl-files 校验 Nvidia 驱动,执行 nvidia-smi,若有如下输出,证明安装成功: TensorFlow 容器 3、CPU 测试 docker run --runtime=nvidia \ --rm -it \ -v "$(pwd)/test.py:/app/test.py" \ registry.docker-cn.com registry.docker-cn.com/tensorflow/tensorflow:latest-gpu \ python /app/test.py gpu 20000 ? GPU 测试结果

    1.3K10发布于 2018-12-19
  • 来自专栏涓流

    设计之CommonPool

    技术 CommonPool 对象管理是一个很重要的功能,无论是数据库连接还是redis连接,都应该特别关注连接的使用,重点关注几个关键的指标是否正常,连接使用不当很有可能导致连接泄露的问题 //创建一个实例 PooledObject<T> makeObject(); void activateObject(PooledObject<T> obj); //去初始, 并且释放资源 void close(); } 一个对象的基本使用方式如下: Object obj = null;//被管理的对象 try { obj = pool.borrowObject } } catch(Exception e) { //获取对象失败 } GenericObjectPool GenericObjectPool 实现了对象的管理 ac.getRemoveAbandonedOnBorrow() && (getNumIdle() < 2) && (getNumActive() > getMaxTotal() - 3)

    62110编辑于 2022-06-28
  • 来自专栏量子位

    共享GPU来了!投身去中心机器学习,比挖矿多赚3

    还在用GPU挖矿?那你可就亏大了。 最近,大洋彼岸出现了一个名叫“Vectordash”的机器学习共享算力平台,用开发者自己的话讲,相当于一个GPU的Airbnb。 ? 有GPU又嫌挖矿赚得太少? 收益是挖矿的3到4倍! AI开发者们在平台上租用共享出来的GPU,价格又只有AWS的1/5。 穷学生 这个简直像福利一样的平台,是穷学生Sharif Shameem和两位小伙伴的业余项目。 没租到GPU,却被Vectordash网站问了一个直击心灵的问题:有兴趣把你的GPU分享出来做机主赚点钱吗? “去中心的机器学习真是亦可赛艇,”陈天奇(XGBoost、MXNet、TVM的作者)说:“但是可能会有安全隐患。” Vectordash创始人回答说,他们用了基于LXC的Hypervisor(虚拟技术的核心,可允许多个操作系统和应用共享一套基础物理硬件)。 不过只是这些,似乎还不能让人完全放心。

    4K20发布于 2018-07-24
  • 来自专栏王磊的博客

    1.技术

    1.技术 技术指的是提前准备一些资源,在需要时可以重复使用这些预先准备的资源。 技术的优点主要有两个:提前准备和重复利用。 2.技术应用 常见的技术的应用有:线程、内存、数据库连接、HttpClient 连接等,接下来,我们分别来看。 2.1 线程 线程的原理很简单,类似于操作系统中的缓冲区的概念。 3.线程介绍 线程是线程使用的一种模式,它将线程和任务的概念分离开,使用线程来执行任务,并提供统一的线程管理和任务管理的实现方法,避免了频繁创建和销毁线程所带来的性能开销。 优点3:管控线程数和任务数 线程提供了更多的管理功能,这里管理功能主要体现在以下两个方面: 控制最大并发数:线程可以创建固定的线程数,从而避免了无限创建线程的问题。 线程技术的典型场景,线程的优点主要有 4 点:1.复用线程,降低了资源消耗;2.提高响应速度;3.提供了管理线程数和任务数的能力;4.更多增强功能。 ​

    83910编辑于 2022-05-09
  • 来自专栏全栈程序员必看

    层的作用

    层理解 2. 层的作用: 3. 函数解析 tf.nn.max_pool(value, ksize, strides, padding, name=None) 4. 代码演示详解维度变化 1. 层理解 层夹在连续的卷积层中间, 用于压缩数据和参数的量。 简而言之,如果输入是图像的话,那么层的最主要作用就是压缩图像。 个人理解的同图片resize方法类似(双线性插值法,邻近法),只不过层用的是取最大值法。 2. 特征降维,我们知道一幅图像含有的信息是很大的,特征也很多,但是有些信息对于我们做图像任务时没有太多用途或者有重复,我们可以把这类冗余信息去除,把最重要的特征抽取出来,这也是操作的一大作用 3. 函数解析 tf.nn.max_pool(value, ksize, strides, padding, name=None) 参数是四个,和卷积很类似: 第一个参数value:需要的输入,一般层接在卷积层后面

    11.5K31编辑于 2022-07-25
领券