首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏程序猿那点儿事儿

    离线安装GPU P40驱动

    /cuda_10.1.168_418.67_linux.run 按提示输入,安装选择全部选择(包括第一个driver) 完成安装后,输入nvidia-smi,有打印显卡信息则驱动安装成功 输入cat

    1.7K40发布于 2020-09-14
  • 来自专栏云云众生s

    Kubernetes驱动3500个GPU的AI训练

    但随着机器学习如今对 GPU 的高额需求,Kubernetes 可以通过起源于 HPC 领域的工具来提供更动态的方式,管理庞大的 GPU 集群。 证明这点的云提供商 CoreWeave 就专注于加速 GPU 工作负载。 6 月,该公司在 MLCommons 的 MLPerf 的第三轮测试中名列榜首。 CoreWeave 启动了一个集群,包含 3,500 个(新发布的)Nvidia H100 GPU,其性能是其他 Kubernetes 集群的 29 倍。 裸金属上的 Kubernetes 所有 GPU 位于一个数据中心,每个服务器有八个 GPU,基于 Intel Sapphire Rapids 平台。 启动时,DPU 会下载一个裁剪过的 Ubuntu 镜像,除了 GPU 和 Infiniband 驱动程序以及 Kubelet 之外几乎没有任何内容。

    80310编辑于 2024-03-28
  • 来自专栏全栈程序员必看

    tensorflow(gpu) win10安装 1060显卡驱动

    CUDA9.0+cuDNNv7+WIN10+1060显卡 一.驱动文件下载 1.上tensorflow官网。查看本机硬件和系统支持的tensorflow版本,以及对应的cuda和cuddnn版本。 查找相应的CUDA驱动。 打开默认下载是9.2版本,如下: 手动搜索9.0版本,严格按照 tensorflow官网推荐的版本。 建议下载local安装包。 3.百度cudnn进网站。 安装 1.安装CUDA驱动 安装前需要把之前NVIDIA的驱动完全卸载掉,才能安装上cuda的驱动。 (这一步是关键,不然后面安装cuda会失败) 然后重启,运行cuda驱动安装文件,按照提示一步步运行,直至结束。 2.解压cuDNN文件。 mirrors.tuna.tsinghua.edu.cn/help/anaconda/ https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 4.

    1.8K30编辑于 2022-08-25
  • 来自专栏Windows技术交流

    A10、T4渲染型GPU机器显示异常,出现横线,通过升级grid驱动解决

    A10、T4渲染型GPU机器显示异常,出现横线,如图 查了下grid驱动版本是grid16.0(536.25) 像这种横线问题,nvidia官网记录了bug https://docs.nvidia.com /vgpu/16.0/grid-vgpu-release-notes-generic-linux-kvm/index.html#resolved-issues 一般升级grid驱动能好 英伟达官网,grid16.0 (切分卡母机驱动还是16版本,保持现状) 17.x版本,尽可能用≥17.2的,兼容的显卡类型更多 16.x版本,尽可能用≥16.6的,bug更少,16.0~16.5都有不同bug 获取驱动版本号:https hl=zh-cn#windows_drivers 查看驱动版本号和操作系统的对应关系,整卡的尽可能用匹配的驱动列表中的高版本 低版本可能有一些横线花屏 https://cloud.tencent.com /developer/article/2446935 代码自动化升级驱动可参考:注意代码分整卡和切分卡,只需要替换url,按整卡、切分卡各自的代码走 https://cloud.tencent.com

    82510编辑于 2024-12-18
  • 来自专栏Windows技术交流

    GPU机器任务管理器GPU利用率很低,是不是驱动有问题?

    3D渲染业务,GPU机器需要安装Grid驱动,Grid驱动安装很麻烦,建议使用2019Grid公共镜像购买GN7vw或GI3X或GNV4或GNV4v机型的机器,2019Grid公共镜像集成好相关驱动了, 任务管理器GPU为啥总是0%?建议搞个压测看看 任务管理器GPU利用率我观察了不到1分钟,发现不总是0%,偶尔也有1%出现,负载低时显示0%、1%不是正常的吗? 压测软件推荐了,打开几秒就能验证 判断有没有安装GRID驱动,并不是从设备管理器显卡名称上看有没有"GRID"字样来判断(只有vGPU机器安装GRID驱动在设备管理器里才会有GRID字样),而是根据桌面右击 /developer/article/1923257 GN7vw或GI3X或GNV4或GNV4v机型的机器如果驱动异常,备份数据后用2019Grid公共镜像重装系统, 2019Grid公共镜像已经集成好驱动 ,无须使用360驱动大师,可能破坏原镜像环境

    2.8K60编辑于 2024-06-20
  • 来自专栏云原生搬运工

    【TKE】GPU 节点 NVIDIA Tesla 驱动重新安装

    使用场景 默认情况下,用户在 TKE 添加 GPU 节点时,会自动预装特定版本 GPU 驱动,但是目前默认安装 GPU 驱动版本是固定的,用户还不能选择要安装的 GPU 驱动版本,当用户有其他版本的 GPU 驱动使用需求时,就需要在节点上重新安装,下面将介绍在 TKE 节点中如何重新安装 GPU 驱动程序。 : [选择 YES] 等待新驱动安装完成: [4lq6xe3jd4.png] 4.测试新驱动 在节点上执行nvidia-smi查看 GPU 情况,可查看到 GPU 信息并显示驱动版本为新版本: [查看 GPU 信息] 查看 k8s 是否识别到节点 GPU 容量,执行命令: kubectl describe node <NodeName> 从 k8s 节点资源查看 GPU 资源是否和实际资源一致,如下图 : image.png 总结 本文简单介绍了如何在 TKE 重新安装 GPU 驱动程序,如有相关需求可按照上述操作安装。

    2K73发布于 2021-06-01
  • 来自专栏巫山跬步

    【玩转腾讯云】GPU云服务器(驱动篇)

    如何选购腾讯云GPU实例?如何优雅地安装驱动等底层开发工具库?这些问题给深度学习等领域研究/开发人员带来了不少困惑。 0x00 环境&目标 我们选择腾讯云目前的主流机型GPU计算机型GN7,其中搭载一颗Tesla T4 GPU。本教程采用的具体规格为GN7.5XLARGE80。 而且,它还是全球市面上同级别GPU机型中(T4)性价比最高的产品。 选购传送门,按量计费的机型做实验更灵活哦~ 本教程中的实例机型:GN7(推荐)、GN10X等GPU机型均可以。 验证GPU驱动安装 —— 设备信息查看 Nvidia GPU驱动是支持CUDA编程的内核模块。 nvidia-smi命令查看GPU设备状态,如驱动版本(440.64.00)、CUDA版本(10.2)、型号(Tesla T4)、显存(15109MiB)以及温度功耗等各种信息,如图: [smi.png

    32.5K4912发布于 2020-04-01
  • 来自专栏Windows技术交流

    如何更新GPU云服务器的NVIDIA驱动

    我自己遇到过系统里有2套驱动nvlddmkm.sys甚至3套nvidia-smi.exe,混乱不堪。在阿里云、腾讯云等云厂商都有nvidia显卡的GPU云服务器,也会有这些问题。 (NVIDIA每月出一个新版驱动驱动本身的健壮性我不敢保障,我这里强调的是驱动安装唯独的严谨性。) Files\NVIDIA Corporation\下面是不存在NVSMI子目录的, 需要处理下这2个目录里4个文件的一致性 C:\Program Files\NVIDIA Corporation\NVSMI Files\NVIDIA Corporation\NVSMI目录下有这4个文件, C:\Program Files\NVIDIA Corporation\NVSMI\MCU.exe C:\Program ,一般是搜那4个文件,在C:\Windows\System32\DriverStore\FileRepository\目录下找这4个同名文件,看更新时间是不是我升级驱动的时间,是的话,我就把这4个文件往下面

    5.8K20编辑于 2024-08-15
  • 来自专栏科学计算

    GPU编程4--Hello World初体验

    函数声明   在GPU编程中,有三种函数的声明: Executed on Only callable from __global__ void KernelFunc() device host __device __ float DeviceFunc() device device __host__ float HostFunt() host host 这里的host端就是指CPU,device端就是指GPU ;使用__global__声明的核函数是在CPU端调用,在GPU里执行;__device__声明的函数调用和执行都在GPU中;__host__声明的函数调用和执行都在CPU端。 并行优化定理   在讲GPU并行计算之前,我们先讲一下使用GPU后能提高性能的理论值,即Amdahld定理,也就是相对串行程序而言,并行程序的加速率。    GPU Hello World Hello World程序是我们学习任何编程语言时,第一个要完成的,虽然cuda c并不是一门新的语言,但我们还是从Hello World开始Cuda编程。

    1.2K00发布于 2020-07-14
  • 来自专栏用户2737519的专栏

    Linux下GPU云服务器安装 NVIDIA Tesla 驱动

    背景介绍: 本篇介绍腾讯云环境GPU云服务器nvidia tesla驱动安装步骤。 驱动安装途径: 目前腾讯云环境下支持安装GPU驱动的方式如下: 使用预装 GPU 驱动的镜像,参考链接:https://cloud.tencent.com/document/product/560/30129 使用公共镜像的时候,支持后台自动安装GPU驱动。 目前官网控制台支持,后台自动安装GPU驱动,如下图: image.png 安装驱动: NVIDIA Telsa GPU 的 Linux 驱动在安装过程种需要编译 kernel module,所以要求系统安装好了 登录NVIDIA 驱动下载或打开链接 http://www.nvidia.com/Download/Find.aspx 。 选择操作系统和安装包。以 P4 为例,搜寻驱动,然后选择要下载的驱动版本。

    5.7K00发布于 2020-01-05
  • 来自专栏虚拟化技术资源

    VMware ESXi安装NVIDIA GPU显卡硬件驱动和配置vGPU

    一、驱动软件准备:从nvidia网站下载驱动,注意,和普通显卡下载驱动地址不同。 按照ESXi对应版本不同下载不同的安装包。安装包内含ESXi主机驱动和虚拟机驱动GPU显卡和物理服务器兼容查询:(重要:一定要查兼容,最近遇到一客户反馈安装驱动后运行nvidia-smi各种报错,最后查询是因为不兼容导致。) 2、正确的安装并加载驱动程序以后,我们需要启动主机的xorg服务,xorg服务是ESXi主机为虚拟机提供3D硬件加速的服务,我们必须启动该服务后才能使GPU正常工作。 3、以下命令可以查看主机是否正确加载了驱动程序: vmkload_mod -l | grep nvidia 4、如下图所示:通过命令nvidia-smi来验证GPU卡是否正常工作,无报错,如图: 5、 6、编辑虚拟机 GPU配置文件为GPU显存大小,具体显存大小参考说明文档。并勾选预留所有内存。

    11.6K70编辑于 2022-03-31
  • 来自专栏HackforFun

    在 RK3399 上运行开源的 mali GPU 驱动

    也有很多人被卡在了第二个关卡,SOC 上搭配了强劲的 GPU、比如 RK3399,S912,他们都搭载了 Arm mali GPU,但是 mainline 内核却缺少相应的驱动支持 —— GPU 驱动一般分为两部分 启动 Panfrost GPU 驱动 在内核里面启用 Panfrost GPU 驱动 ? 默认编译到内核中或者以模块的形式加载都可以。 如果 Panfrost GPU 驱动正常加载,我们会看到类似下面的 Log: ? cat /proc/interrupts 可以看到 Panfrost GPU 驱动注册的中断: ? 安装依赖 前面有讲到,GPU 驱动分两部分,一部分在内核中,我们已经启动了,另外还有一个重要的部分在 userspace 中,对于 Panfrost GPU 驱动来说,它叫做 mesa。 编译安装 mesa mesa 中实现了 Panfrost GPU 驱动的 userspace 部分,它向下操作内核中的 GPU 驱动,向上提供标准的 opengl 接口供各种绘图应用使用。

    24.6K97发布于 2020-01-13
  • 来自专栏Opensoure翻译

    4步让你驱动Kubernetes【Containers】

    在本系列的第三篇文章中,我介绍了Kubernetes的基础知识:首先学习如何驱动,我强调您应该学会驱动Kubernetes,而不是构建它。 在第四篇文章中,我将分享一些工具,这些工具将帮助您学习快速驱动Kubernetes。 1. Katacoda Katacoda是最简单的手动测试Kubernetes集群的方法。 4. Visual Studio代码 我最后保存了我的最爱之一。 我的大部分工作都使用vi,但我从未为Kubernetes找到一个好的语法突出显示和代码完成插件(如果有,请告诉我)。 当您第一次学习驱动Kubernetes时,这是非常好的。 您可以构建Pod,服务,复制控制器,部署等。 结论 这四个工具(如果算上这两个插件,则为六个)将帮助您学习驱动Kubernetes,而不是构建或装备它。

    2K00发布于 2019-11-12
  • 来自专栏开源FPGA

    基于FPGA的4x4矩阵键盘驱动调试

    FPGA驱动4x4矩阵键盘。这个其实原理是十分简单,但是由于博主做的时候遇到了一些有意思的情况,所以我个人觉得值得记录分享一下。        首先找了本书看了下矩阵键盘的驱动原理,一般来说4x4矩阵键盘的原理图如下,有四根行线和四根列线,行选通和列选通可以确定键盘上的一个位置。 其他按键类似,就是利用这个原理来驱动矩阵键盘。 ?        ,而这个地方加不加其实和驱动开发板的构造有关,据我了解,有些单片机的I/O引脚会内置上拉电阻,默认情况下是高电平,所以用这些单片机驱动是不需要加上拉电阻的。        在引脚约束在电平为3.3v时加上pull up,可以等下出相当于10.8k欧姆的电阻这和矩阵键盘的驱动原理是完全相符。 ?       

    1.4K20发布于 2018-08-20
  • 来自专栏全栈程序员必看

    v4l2驱动框架(Windows驱动开发技术详解)

    ; set_bit(V4L2_FL_USES_V4L2_FH, &sv->vdev.flags); video_set_drvdata(&sv->vdev, sv); //将sv设置为驱动私有数据 下面介绍一下V4L2整体情况: V4L2提供一套数据结构和底层V4L2驱动接口规范供Linux下的视频设备程序使用,主要是一系列回调函数,如设置摄像头频率,帧率,视频压缩格式和图像参数等,还可用于其他多媒体开发 一般采用V4L2驱动的摄像头设备文件是/dev/video0,V4L2支持两种方式采集图像:内存映射方式mmap和直接读取方式read。 驱动分配视频缓冲区,也就是申请V4L2视频驱动分配内存,V4L2是视频设备的驱动层,它位于内核空间,因此通过VIDIOC_REQBUFS控制命令申请的内存空间位于内核空间中,应用程序不能直接访问,需要调用 若成功,则会在V4L2驱动层分配好视频缓冲区。

    3.3K10编辑于 2022-07-28
  • 来自专栏人工智能领域

    GPU计算型实例中安装Tesla驱动超详细过程

    摘要:在深度学习、AI等通用计算业务场景或者OpenGL、Direct3D、云游戏等图形加速场景下,安装了Tesla驱动GPU才可以发挥高性能计算能力,或提供更流畅的图形显示效果。 如果您在创建GPU计算型实例(Linux)时未同时安装Tesla驱动,则需要在创建GPU实例后,单独安装Tesla驱动(Linux)。 step4 Nouveau驱动禁用通知 这段内容是NVIDIA图形驱动程序安装过程中的一条通知,它告知用户Nouveau驱动已经被禁用,具体内容如下: NVIDIA加速图形驱动程序:这是为Linux 具体操作,请参见在GPU计算型实例中手动安装Tesla驱动(Windows)。 如果您需要在创建GPU实例时同时安装了Tesla驱动,具体操作,请参见创建GPU实例时自动安装或加载Tesla驱动。 如果GPU实例中安装的驱动版本不适用于当前场景,或您安装了错误的驱动类型或版本导致GPU实例无法使用,您可以卸载当前驱动然后安装新的驱动或直接升级驱动

    2.3K10编辑于 2024-12-18
  • 来自专栏GPUS开发者

    NVFP4:打破GPU推理的内存墙,4位浮点时代来了

    NVFP4采用了双层缩放策略。第一层是微块缩放:每16个连续的NVFP4数值共享一个E4M3格式的FP8缩放因子。 为什么是16而非MXFP4的32? NVFP4需要Blackwell架构及以上的GPU才能实现硬件加速 ,在Hopper或更早的架构上虽然可以通过软件模拟运行 ,但性能优势会大打折扣。 量化感知训练(QAT) 与NVFP4的结合也在深入研究 ,让模型从训练阶段就适应低比特表⽰ ,进一步缩小精度差距。 对于GPU开发者而言 ,现在是熟悉NVFP4的最佳时机。 对于正在规划硬件采购的团队 ,Blackwell架构的GPU应该被优先考虑 ,以充分发挥NVFP4的性能潜力。 当内存墙不再是瓶颈 ,GPU开发者将有更大的空间去探索模型规模、上下文长度、多模态融合的边界。4位浮点时代已经来临 ,你准备好了吗?

    77910编辑于 2026-01-27
  • 来自专栏罗西的思考

    NVIDIA HugeCTR,GPU版本参数服务器--- (4)

    [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (4) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (4) 0x00 摘要 0x01 总体流程 分配内存 } // 4. // 这里设定了每个线程对应的 GPU 资源 auto local_gpu = resource_manager_->get_local_gpu(i % local_gpu_count runtime_error& rt_err) { std::cerr << rt_err.what() << std::endl; } } 所以,这里就设定了哪个样本应该放到哪个卡上,例如,下面4个线程 ,分别对应了 GPU 0 和 GPU 1。

    1.1K10编辑于 2022-11-28
  • 来自专栏新智元

    英伟达开源Linux版GPU内核驱动

    ---- 新智元报道   编辑:David 【新智元导读】英伟达宣布开源Linux GPU内核驱动模块,开发者纷纷表示「活久见」,不会和之前Linux之父对英伟达的「友善度词汇」有关吧? 英伟达显卡驱动开源了?这不像是老黄会做出的事啊? 可这事确实是真的。不过有一点点条件,一是Linux系统,二是开源的是GPU的内核模块。 5月12日,英伟达官网发布消息,将Linux GPU内核模块作为开放源码发布,具有GPL/MIT双重许可证,开源从R515驱动版本开始。 对于Linux发行商来说,提高了使用的便利性,改善了开箱即用的用户体验,以签署和分发NVIDIA GPU驱动程序。 每次发布新的驱动程序时,英伟达都会在GitHub上发布源代码的快照。 我们对英伟达决定开源GPU内核驱动程序表示赞赏。Red Hat与英伟达合作多年,我们很高兴看到他们终于迈出了这一步」 被「Linux之父」骂的?

    2.7K50编辑于 2022-05-16
  • 来自专栏机器之心

    老游戏,新画质:英伟达GPU驱动新功能上线

    以后或许不需要等开发商出「高清重置版」,只需要升级一下显卡驱动就可以了。 本周五,英伟达的 GeForce 显卡驱动迎来了又一次更新,其中 AI 重制经典游戏的功能引人关注。 英伟达的最新版本 Game ready 驱动提升了包括主机移植游戏《战神 4》PC 版的支持,还包括了一个新工具,可以在不提升 GPU 负载的情况下增强游戏画质。 因此假如你在有 1440p 显示器的电脑上以 4K 分辨率运行游戏,使用 DSR 会提升清晰度。但 Downscale 渲染会消耗一部分算力——毕竟这是在要求 GPU 进行额外的运算。 英伟达使用 Bethesda 在 2017 年发行的第一人称射击游戏《掠食》作为示例,在 1080p 显示器上运行时若使用 4x DSR 渲染会以 108 FPS 运行,而 2.25x DLDSR 则让帧数达到了

    1.1K20编辑于 2022-02-23
领券