首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏程序猿那点儿事儿

    离线安装GPU P40驱动

    /cuda_10.1.168_418.67_linux.run 按提示输入,安装选择全部选择(包括第一个driver) 完成安装后,输入nvidia-smi,有打印显卡信息则驱动安装成功 输入cat

    1.7K40发布于 2020-09-14
  • 来自专栏云云众生s

    Kubernetes驱动3500个GPU的AI训练

    但随着机器学习如今对 GPU 的高额需求,Kubernetes 可以通过起源于 HPC 领域的工具来提供更动态的方式,管理庞大的 GPU 集群。 证明这点的云提供商 CoreWeave 就专注于加速 GPU 工作负载。 6 月,该公司在 MLCommons 的 MLPerf 的第三轮测试中名列榜首。 CoreWeave 启动了一个集群,包含 3,500 个(新发布的)Nvidia H100 GPU,其性能是其他 Kubernetes 集群的 29 倍。 裸金属上的 Kubernetes 所有 GPU 位于一个数据中心,每个服务器有八个 GPU,基于 Intel Sapphire Rapids 平台。 启动时,DPU 会下载一个裁剪过的 Ubuntu 镜像,除了 GPU 和 Infiniband 驱动程序以及 Kubelet 之外几乎没有任何内容。

    73910编辑于 2024-03-28
  • 来自专栏全栈程序员必看

    tensorflow(gpu) win10安装 1060显卡驱动

    CUDA9.0+cuDNNv7+WIN10+1060显卡 一.驱动文件下载 1.上tensorflow官网。查看本机硬件和系统支持的tensorflow版本,以及对应的cuda和cuddnn版本。 查找相应的CUDA驱动。 打开默认下载是9.2版本,如下: 手动搜索9.0版本,严格按照 tensorflow官网推荐的版本。 建议下载local安装包。 3.百度cudnn进网站。 安装 1.安装CUDA驱动 安装前需要把之前NVIDIA的驱动完全卸载掉,才能安装上cuda的驱动。 (这一步是关键,不然后面安装cuda会失败) 然后重启,运行cuda驱动安装文件,按照提示一步步运行,直至结束。 2.解压cuDNN文件。

    1.8K30编辑于 2022-08-25
  • 来自专栏Windows技术交流

    GPU机器任务管理器GPU利用率很低,是不是驱动有问题?

    3D渲染业务,GPU机器需要安装Grid驱动,Grid驱动安装很麻烦,建议使用2019Grid公共镜像购买GN7vw或GI3X或GNV4或GNV4v机型的机器,2019Grid公共镜像集成好相关驱动了, 任务管理器GPU为啥总是0%?建议搞个压测看看 任务管理器GPU利用率我观察了不到1分钟,发现不总是0%,偶尔也有1%出现,负载低时显示0%、1%不是正常的吗? 压测软件推荐了,打开几秒就能验证 判断有没有安装GRID驱动,并不是从设备管理器显卡名称上看有没有"GRID"字样来判断(只有vGPU机器安装GRID驱动在设备管理器里才会有GRID字样),而是根据桌面右击 /developer/article/1923257 GN7vw或GI3X或GNV4或GNV4v机型的机器如果驱动异常,备份数据后用2019Grid公共镜像重装系统, 2019Grid公共镜像已经集成好驱动 ,无须使用360驱动大师,可能破坏原镜像环境

    2.8K60编辑于 2024-06-20
  • 来自专栏云原生搬运工

    【TKE】GPU 节点 NVIDIA Tesla 驱动重新安装

    使用场景 默认情况下,用户在 TKE 添加 GPU 节点时,会自动预装特定版本 GPU 驱动,但是目前默认安装 GPU 驱动版本是固定的,用户还不能选择要安装的 GPU 驱动版本,当用户有其他版本的 GPU 驱动使用需求时,就需要在节点上重新安装,下面将介绍在 TKE 节点中如何重新安装 GPU 驱动程序。 : [选择 YES] 等待新驱动安装完成: [4lq6xe3jd4.png] 4.测试新驱动 在节点上执行nvidia-smi查看 GPU 情况,可查看到 GPU 信息并显示驱动版本为新版本: [查看 GPU 信息] 查看 k8s 是否识别到节点 GPU 容量,执行命令: kubectl describe node <NodeName> 从 k8s 节点资源查看 GPU 资源是否和实际资源一致,如下图 : image.png 总结 本文简单介绍了如何在 TKE 重新安装 GPU 驱动程序,如有相关需求可按照上述操作安装。

    1.9K73发布于 2021-06-01
  • 来自专栏巫山跬步

    【玩转腾讯云】GPU云服务器(驱动篇)

    如何选购腾讯云GPU实例?如何优雅地安装驱动等底层开发工具库?这些问题给深度学习等领域研究/开发人员带来了不少困惑。 推荐选择的系统镜像:Ubuntu 18.04 (注意无需勾选“后台自动安装GPU驱动”) 其他信息:北京五区,1M公网带宽,系统盘大小100G。根据实际情况选择即可。 验证GPU驱动安装 —— 设备信息查看 Nvidia GPU驱动是支持CUDA编程的内核模块。 总之就是,驱动只需安装一次,非常方便。 重启后登录,我们来验证驱动模块已动态加载 [after.png] 可以看到,nouveau等社区驱动已经不会被加载,而是加载了nvidia的官方驱动。 nvidia-smi命令查看GPU设备状态,如驱动版本(440.64.00)、CUDA版本(10.2)、型号(Tesla T4)、显存(15109MiB)以及温度功耗等各种信息,如图: [smi.png

    32.4K4912发布于 2020-04-01
  • 来自专栏Windows技术交流

    如何更新GPU云服务器的NVIDIA驱动

    我自己遇到过系统里有2套驱动nvlddmkm.sys甚至3套nvidia-smi.exe,混乱不堪。在阿里云、腾讯云等云厂商都有nvidia显卡的GPU云服务器,也会有这些问题。 (NVIDIA每月出一个新版驱动驱动本身的健壮性我不敢保障,我这里强调的是驱动安装唯独的严谨性。) 首先,卸载干净旧驱动,卸载的话先运行appwiz.cpl从程序列表正常卸载,卸载后会提示重启,重启后appwiz.cpl里是否变成低版本驱动了(我自己就遇到了,明明卸载新安装的驱动,重启后发现appwiz.cpl (之前有次,2个目录的nvidia-smi.exe执行结果不一样,搞得我很恼火,发现是windows联网情况下自动更新驱动了,不知道NVIDIA咋处理的,反正是乱了,后来还是我手动搞一致的,为了避免自动更新驱动导致问题 ,我把自动更新驱动禁止了,参考https://cloud.tencent.com/developer/article/2070462)

    5.7K20编辑于 2024-08-15
  • 来自专栏用户2737519的专栏

    Linux下GPU云服务器安装 NVIDIA Tesla 驱动

    背景介绍: 本篇介绍腾讯云环境GPU云服务器nvidia tesla驱动安装步骤。 有很多腾讯云的使用者,在使用GPU服务器过程中,对驱动安装或者使用中有一些疑惑,比如系统kernel更新了,驱动失效了等问题。 驱动安装途径: 目前腾讯云环境下支持安装GPU驱动的方式如下: 使用预装 GPU 驱动的镜像,参考链接:https://cloud.tencent.com/document/product/560/30129 使用公共镜像的时候,支持后台自动安装GPU驱动。 目前官网控制台支持,后台自动安装GPU驱动,如下图: image.png 安装驱动: NVIDIA Telsa GPU 的 Linux 驱动在安装过程种需要编译 kernel module,所以要求系统安装好了

    5.6K00发布于 2020-01-05
  • 来自专栏虚拟化技术资源

    VMware ESXi安装NVIDIA GPU显卡硬件驱动和配置vGPU

    一、驱动软件准备:从nvidia网站下载驱动,注意,和普通显卡下载驱动地址不同。 按照ESXi对应版本不同下载不同的安装包。安装包内含ESXi主机驱动和虚拟机驱动GPU显卡和物理服务器兼容查询:(重要:一定要查兼容,最近遇到一客户反馈安装驱动后运行nvidia-smi各种报错,最后查询是因为不兼容导致。) 2、正确的安装并加载驱动程序以后,我们需要启动主机的xorg服务,xorg服务是ESXi主机为虚拟机提供3D硬件加速的服务,我们必须启动该服务后才能使GPU正常工作。 3、以下命令可以查看主机是否正确加载了驱动程序: vmkload_mod -l | grep nvidia 4、如下图所示:通过命令nvidia-smi来验证GPU卡是否正常工作,无报错,如图: 5、 6、编辑虚拟机 GPU配置文件为GPU显存大小,具体显存大小参考说明文档。并勾选预留所有内存。

    11K70编辑于 2022-03-31
  • 来自专栏HackforFun

    在 RK3399 上运行开源的 mali GPU 驱动

    也有很多人被卡在了第二个关卡,SOC 上搭配了强劲的 GPU、比如 RK3399,S912,他们都搭载了 Arm mali GPU,但是 mainline 内核却缺少相应的驱动支持 —— GPU 驱动一般分为两部分 启动 Panfrost GPU 驱动 在内核里面启用 Panfrost GPU 驱动 ? 默认编译到内核中或者以模块的形式加载都可以。 如果 Panfrost GPU 驱动正常加载,我们会看到类似下面的 Log: ? cat /proc/interrupts 可以看到 Panfrost GPU 驱动注册的中断: ? 安装依赖 前面有讲到,GPU 驱动分两部分,一部分在内核中,我们已经启动了,另外还有一个重要的部分在 userspace 中,对于 Panfrost GPU 驱动来说,它叫做 mesa。 编译安装 mesa mesa 中实现了 Panfrost GPU 驱动的 userspace 部分,它向下操作内核中的 GPU 驱动,向上提供标准的 opengl 接口供各种绘图应用使用。

    24.4K97发布于 2020-01-13
  • 来自专栏人工智能领域

    GPU计算型实例中安装Tesla驱动超详细过程

    摘要:在深度学习、AI等通用计算业务场景或者OpenGL、Direct3D、云游戏等图形加速场景下,安装了Tesla驱动GPU才可以发挥高性能计算能力,或提供更流畅的图形显示效果。 如果您在创建GPU计算型实例(Linux)时未同时安装Tesla驱动,则需要在创建GPU实例后,单独安装Tesla驱动(Linux)。 这个警告的目的是确保用户意识到在安装NVIDIA驱动程序后需要重启计算机,以确保所有更改生效,并且系统能够正确使用NVIDIA GPU。 具体操作,请参见在GPU计算型实例中手动安装Tesla驱动(Windows)。 如果您需要在创建GPU实例时同时安装了Tesla驱动,具体操作,请参见创建GPU实例时自动安装或加载Tesla驱动。 如果GPU实例中安装的驱动版本不适用于当前场景,或您安装了错误的驱动类型或版本导致GPU实例无法使用,您可以卸载当前驱动然后安装新的驱动或直接升级驱动

    2K10编辑于 2024-12-18
  • 来自专栏新智元

    英伟达开源Linux版GPU内核驱动

    ---- 新智元报道   编辑:David 【新智元导读】英伟达宣布开源Linux GPU内核驱动模块,开发者纷纷表示「活久见」,不会和之前Linux之父对英伟达的「友善度词汇」有关吧? 英伟达显卡驱动开源了?这不像是老黄会做出的事啊? 可这事确实是真的。不过有一点点条件,一是Linux系统,二是开源的是GPU的内核模块。 5月12日,英伟达官网发布消息,将Linux GPU内核模块作为开放源码发布,具有GPL/MIT双重许可证,开源从R515驱动版本开始。 对于Linux发行商来说,提高了使用的便利性,改善了开箱即用的用户体验,以签署和分发NVIDIA GPU驱动程序。 每次发布新的驱动程序时,英伟达都会在GitHub上发布源代码的快照。 我们对英伟达决定开源GPU内核驱动程序表示赞赏。Red Hat与英伟达合作多年,我们很高兴看到他们终于迈出了这一步」 被「Linux之父」骂的?

    2.7K50编辑于 2022-05-16
  • 来自专栏机器之心

    老游戏,新画质:英伟达GPU驱动新功能上线

    以后或许不需要等开发商出「高清重置版」,只需要升级一下显卡驱动就可以了。 本周五,英伟达的 GeForce 显卡驱动迎来了又一次更新,其中 AI 重制经典游戏的功能引人关注。 英伟达的最新版本 Game ready 驱动提升了包括主机移植游戏《战神 4》PC 版的支持,还包括了一个新工具,可以在不提升 GPU 负载的情况下增强游戏画质。 但 Downscale 渲染会消耗一部分算力——毕竟这是在要求 GPU 进行额外的运算。 超分辨率技术 DLDSR 采用相同的概念,但结合了人工智能算法,也可以用来增强图像。

    1.1K20编辑于 2022-02-23
  • 来自专栏欢迎加入非凸科技

    用Rust编写的Linux内核GPU驱动程序,或将到来

    外媒 Phoronix 报道,Asahi Linix 的核心开发者 Asahi Lina 正在探索用 Rust 编程语言编写该 DRM 内核 GPU 驱动程序的可行性。 如果成功了,这将是第一个用 Rust 语言编写的 Linux 内核 GPU 驱动程序。 鉴于目前尚未有 Rust 编写的实际驱动程序代码,驱动程序的 Rust 实现有几种可能性:1.完全使用 Rust 实现(涉及 DRM 子系统的渲染部分);2.只是大部分固件交互逻辑在 Rust 中完成, 然后顶层驱动程序用 C 编写并调用 Rust 抽象层。

    1.9K40编辑于 2022-08-16
  • 来自专栏GPU Lab

    GPU计算型GC3vq:驱动与AI环境部署指引

    腾讯云为GPU云服务器GC3vq机型提供特定驱动安装脚本,同时提供CUDA、cuDNN和相关的AI框架自动安装脚本,在活动页购买的机器,腾讯云提供以下三种脚本部署,您可以根据需要选择:机型操作系统软件环境执行命令 GC3vqUbuntu 18.04/20.04CentOS 7.6/7.8/7.9【驱动安装】vqGPU-DRIVER1.0.0_cuda11.4.3:CUDA11.4.3 + cuDNN8.2.4 + vqGPU驱动wget https://gpu-related-scripts-1251783334.cos.ap-guangzhou.myqcloud.com/gpu-auto-install/gpu_auto_install.sh cuda11.4.3:TensorFlow 2.8.0 + Miniconda + OpenCV 4 + Python 3.9.12 + CUDA11.4.2 + cuDNN8.2.4 + vqGPU驱动 Pytorch 1.9.1 + torchvision0.10.0 + Miniconda + OpenCV 4 + Python 3.8 + CUDA11.4.2 + cuDNN8.2.4 + vqGPU驱动

    1.2K10编辑于 2023-03-03
  • 来自专栏专栏名称都被占用了

    TKE集群ubuntu 16.04节点更新GPU驱动和CUDA Toolkit

    前置条件 我是切换到root下执行的,如果非root用户,请按需sudo 本例为ubuntu16.04系统升级驱动和CUDA Toolkit 原版本: Driver Version: 410.79 首先确认CUDA和驱动以及硬件设备、系统、软件包的兼容性,可参考如下网站自查 Release Notes :: CUDA Toolkit Documentation CUDA Compatibility 显示当前系统GPU相关的驱动版本为410.79 root@VM-1-43-ubuntu:~# dpkg -l |grep '^ii' |grep nvidia ii libnvidia-container-tools 按需下载所需的驱动和CUDA Toolkit 驱动:Advanced Driver Search CUDA Toolkit:CUDA Toolkit Archive 5. 显示系统更新后的GPU相关的驱动版本(为440.95.01) root@VM-1-43-ubuntu:~# dpkg -l |grep '^ii' |grep nvidia ii libnvidia-container-tools

    1.8K30发布于 2021-07-19
  • 来自专栏人工智能LeadAI

    Nvidia GPU驱动与CUDA、Ubuntu内核兼容性问题的解决日志

    重启之后,发现GPU无法正常使用,出现无法登录系统、分辨率改变等问题,与Ubuntu 16.04安装NVIDIA驱动后循环登录问题中描述的症状一致。 操作系统:ubuntu 16.04 系统内核: Linux version 4.13.0-31-generic GPU: GTX 1080 CUDA:cuda-9.1, cudnn-7.0.1,deb (local)安装方式 nvidia driver: nvidia driver 387.26 Nvidia已经更新了驱动,只需要安装新的驱动就可以解决linux kernel和nvidia driver 不过,devtalk安装的新驱动版本为nvidia driver 390,在尝试了单独下载该驱动的run文件安装方式和deb (network)安装方式之后,发现前一种安装方式因为著名的nouveau问题而安装失败 解决方法 首先,在PPA GPU查看驱动的版本(Current official release: nvidia-387 (387.34)...) 1、卸载现有GPU驱动 2、PPA安装新的GPU驱动

    2.5K30发布于 2018-07-26
  • 来自专栏Windows技术交流

    如何让安装了显卡驱动GPU机器的VNC能正常使用

    腾讯云官网文档写的GPU机器VNC 不可用,实测2019Grid11中英文镜像,有一个vnc是正常的,有一个vnc不能用,我就对比了下2个镜像买的机器的差异,发现点技巧。 如何让安装了显卡驱动GPU机器的VNC能正常使用,有两种方法。 二、破除显卡驱动 想办法让操作系统在开机时不加载显卡驱动,让安装了显卡驱动GPU机器的VNC能正常使用(仅限OS问题排查,排查完毕后要复原回去) NVIDIA有2个服务、1个驱动是开机启动项,光从服务列表禁用那 \Services\nvlddmkm 禁止显卡驱动的命令: reg add "HKLM\SYSTEM\CurrentControlSet\Services\nvlddmkm" /v "Start" /d REG_DWORD /f reg add "HKLM\SYSTEM\ControlSet001\Services\nvlddmkm" /v "Start" /d 4 /t REG_DWORD /f 恢复显卡驱动的命令

    4K30编辑于 2021-12-15
  • 来自专栏Windows技术交流

    渲染型GPU实例变更grid驱动版本可以参考官网文档的.bat替换驱动文件URL即可

    hl=zh-cn#windows_drivers 蹭下谷歌云的链接 下载速度还可以 试到哪个版本可以,存一份到跟cvm同地域的cos,然后升级驱动的.bat里的下载链接替换成同地域cos链接 https

    37610编辑于 2024-03-20
  • 来自专栏全栈程序员必看

    虚拟GPU_vmware gpu

    两个术语:SRIOV的PF,VF (专业人士请自动忽略这部分介绍 ) PF:宿主机上的主设备,宿主机上的GPU驱动安装在PF上。PF的驱动是管理者。 它就是一个完备的设备驱动,与一般的GPU驱动的区别在于它管理了所有VF设备的生命和调度周期。比如下图的07:00.0便是PF设备 VF:也是一个PCI设备,如下图中的07:02.0和07:02.1。 由于S7150是中断驱动的结构,所以通过查看虚拟机内部GPU中断的分布情况就可大致判断出GPU SRIOV对这个虚拟机的调度策略。 对于Linux的客户机,则更简单,直接查看GPU驱动的trace event。当然我们要感谢AMD在提供给Linux内核的SRIOV VF驱动上没有去掉trace event。 并选择Ubuntu(预装AMD驱动)作为系统镜像; 在Console下查看所有的GPU相关的trace如下表: 很不错,我们发现有两个GPU驱动分发workload的event:amd_sched_job

    3.7K31编辑于 2022-11-16
领券