首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据杂货铺

    Cloudera机器学习中的NVIDIA RAPIDS

    Cloudera Data Platform上的RAPIDS预先配置了所有必需的库和依赖项,以将RAPIDS的功能带到您的项目中。 什么是RAPIDS RAPIDS将GPU计算的功能带到标准的数据科学操作中,无论是探索性数据分析、特征工程还是模型构建。 有关更多信息,请参见:< https://rapids.ai/ > RAPIDS库旨在替代常见的Python数据科学库,例如Pandas(cuDF),numpy(cuPy),sklearn(cuML)和 作为机器学习问题,这是具有表格式数据的分类任务,非常适合RAPIDS。 本教程的重点是利用RAPIDS库的机制,而不是为排行榜构建性能最佳的模型。 RAPIDS集或Pandas集。只需运行这些单元格之一。 该笔记本仅加载训练和测试数据集。

    1.3K20发布于 2021-07-02
  • 来自专栏素质云笔记

    nvidia-rapids︱cuML机器学习加速库

    cuML是一套用于实现与其他RAPIDS项目共享兼容API的机器学习算法和数学原语函数。 关联文章: nvidia-rapids︱cuDF与pandas一样的DataFrame库 NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10 nvidia-rapids︱cuML 机器学习加速库 nvidia-rapids︱cuGraph(NetworkX-like)关系图模型 ---- 文章目录 1 安装与背景 1.1 安装 1.2 背景 2 DBSCAN 3 TSNE算法在 create -n cuml_dev python=3.7 --file=conda/environments/cuml_dev_cuda10.0.yml docker版本,可参考:https://rapids.ai Press Release NVIDIA Blog Developer Blog NVIDIA Data Science Webpage ---- 5 利用KNN进行图像检索 参考:在GPU实例上使用RAPIDS

    4.1K21发布于 2020-03-27
  • 来自专栏Python大数据分析

    RAPIDS cuDF,让数据处理飞起来~

    英伟达的RAPIDS cuDF就是利用GPU加速Pandas和Polars的一个神器,它可以让Pandas和Polars的代码运行在GPU上。 什么是RAPIDS cuDF? 接触过数据科学和机器学习的小伙伴可能都会知道英伟达的RAPIDS,它是大名鼎鼎的GPU加速系统,通过GPU的并行能力来为数据处理、机器学习提升效率。 接下来再来看看cuDF如何加速Polars GPU Engine,英伟达将RAPIDS cuDF中的能力迁移到了Polars之中。 如果是更深入的学习,则需要看RAPIDS的文档,虽然是英文的,但是读起来并不难。 通过利用GPU的并行计算能力,RAPIDS cuDF不仅大大提升了数据处理的速度,还简化了数据处理的复杂性。

    65300编辑于 2025-01-19
  • 来自专栏素质云笔记

    NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10

    随着新版本的推出,RAPIDS 迎来了其推出一周年纪念日。回顾所经历的一年,RAPIDS团队就社区对该项目的关心和支持表示衷心的感谢。此前,RAPIDS获得了其首个BOSSIE奖。非常感谢各位的支持! 关联文章: nvidia-rapids︱cuDF与pandas一样的DataFrame库 NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10 nvidia-rapids︱cuML 机器学习加速库 nvidia-rapids︱cuGraph(NetworkX-like)关系图模型 ---- 文章目录 RAPIDS RAPIDS定义 rapids背景资料 RAPIDS核心库更新 cuDF RAPIDS加速库 支持实例 如何在GPU实例上使用RAPIDS加速库 参考文献 ---- RAPIDS RAPIDS定义 RAPIDS,全称Real-time Acceleration Platform RAPIDS团队希望与你共同努力,不断完善RAPIDS

    3.6K31发布于 2020-03-27
  • 来自专栏软硬件融合

    Intel Sapphire Rapids CPU,吹响反攻DPU的号角

    3 Intel Sapphire Rapids CPU介绍 Sapphire Rapids是Intel新一代的数据中心CPU,用于接替Ice Lake。 Sapphire Rapids相比Ice lake,从单个TILE变成了4个TILE的Chiplet集成。 而Sapphire Rapids的最大创新则是:AIA。 Sapphire Rapids的出现,第一次从CPU的视角,试图统一各种加速器和CPU的控制和数据交互方式,也即加速器呈现给Host CPU的架构。未来,AIA的方式能否成功,大家拭目以待。 Intel Sapphire Rapids,代表着CPU的一个重要的发展趋势是:CPU芯片不断融合各类加速器核,使得自己成为更加综合和均衡的新型处理器。

    77820编辑于 2022-12-16
  • 来自专栏素质云笔记

    nvidia-rapids︱cuGraph(NetworkX-like)关系图模型

    RAPIDS cuGraph库是一组图形分析,用于处理GPU数据帧中的数据 - 请参阅cuDF。 关联文章: nvidia-rapids︱cuDF与pandas一样的DataFrame库 NVIDIA的python-GPU算法生态 ︱ RAPIDS 0.10 nvidia-rapids︱cuML 几个月前,RAPIDS收到了来自佐治亚理工学院的Hornet副本,并将其重构和重命名为cuHornet。 这一名称更改表明,源代码已偏离Georgia Tech基准并体现了代码API和数据结构与RAPIDS cuGraph的匹配。 cuGraph是RAPIDS的图形分析库,针对cuGraph我们推出了一个由两个新原语支持的多GPU PageRank算法:这是一个COO到CSR的多GPU数据转换器,和一个计算顶点度的函数。

    2.1K10发布于 2020-03-27
  • 来自专栏素质云笔记

    nvidia-rapids︱cuDF与pandas一样的DataFrame库

    ---- 官方文档: 1 Docs » API Reference 2 rapidsai/cudf 相关参考: nvidia-rapids︱cuDF与pandas一样的DataFrame库 NVIDIA 的python-GPU算法生态 ︱ RAPIDS 0.10 nvidia-rapids︱cuML机器学习加速库 nvidia-rapids︱cuGraph(NetworkX-like)关系图模型 - 此外,RAPIDS添加了cuStreamz元数据包,因此可以使用cuDF和Streamz库简化GPU加速流处理。 RAPIDS内存管理器库RMM也正在进行一系列重组。这次重组包括一个基于内存资源的新架构,该架构与C ++ 17 std :: pmr :: memory_resource大多兼容。 -c nvidia -c numba -c conda-forge \ cudf=0.10 python=3.6 cudatoolkit=10.1 docker版本,可参考:https://rapids.ai

    2.8K10发布于 2020-03-27
  • 来自专栏Python进阶之路

    Python 实用技能 RAPIDS | 利用 GPU 加速数据科学工作流程

    RAPIDS 官方文档:https://rapids.ai/index.html 介绍 RAPIDS:https://www.youtube.com/watch? Rapids 的美妙之处在于它与数据科学库的整合非常顺畅:像 pandas DataFrames 可以容易地传递到 Rapids,以实现 GPU 加速。 ---- 三、RAPIDS 实践 通过前面的了解,知道 RAPIDS 可以利用 GPU 加速数据科学。现在重要的是我们需要配置环境和实践一下,感受一下怎么用的! 要安装 RAPIDS,请访问:https://rapids.ai/start.html,在这里你将看到如何安装 RAPIDS。 】GPU数据科学加速包——RAPIDS

    3.1K51编辑于 2022-12-25
  • 来自专栏Hadoop实操

    0879-7.1.7-如何在CDP安装NVIDIA Tesla T4并使用RAPIDS加速

    ,手动狗头 比亚迪西安研发中心(与深圳协同办公),base西安,招聘大数据平台运维、架构方向的工程师,实时计算方向工程师,感兴趣的小伙伴请投递简历至dong.rui@byd.com 1.文档编写目的 RAPIDS 全称是Real-time Acceleration Platform for Integrated Data Science,是 NVIDIA 针对数据科学和机器学习推出的 GPU 加速库,RAPIDS NVIDIA借助这个功能,推出针对Spark的RAPIDS Plugin, 将Spark上数据处理迁移到GPU中,只需要用户做简单的代码修改,就可以感受GPU的高性能计算。 我们再来看看官方给出的ETL在CPU和GPU上的对比数据: 本文主要描述如何在CDP7.1.7中对计算节点安装NVIDIA Tesla T4,并使用RAPIDS对Spark3应用进行加速。 /spark-rapids/ Getting Startedhttps://nvidia.github.io/spark-rapids/docs/get-started/getting-started-on-prem.html

    1.2K20编辑于 2022-04-28
  • 来自专栏量子位

    英伟达新开源GPU加速平台:主打数据科学和机器学习,50倍于CPU

    并且RAPIDS不是光比不用,发布之前,就已经经过一些企业真枪实弹检验。 比如沃尔玛。 开源 因为RAPIDS,可以说从开源社区中来,到开源社区中去。 此外,为了推动RAPIDS的广泛应用,英伟达也努力将RAPIDS与Apache Spark进行整合,后者是分析及数据科学方面领先的开源框架。 所以现在,全套RAPIDS开源库,前往 http://www.rapids.ai 就能获得,且代码经 Apache 许可公布。 最后,再次送上传送门: 全套RAPIDS开源库: http://www.rapids.ai — 完 —

    87230发布于 2018-11-22
  • 来自专栏芯智讯

    英特尔第五代Xeon处理器细节曝光:最高64核心,性能提升40%!

    12月6日消息,英特尔很快即将在本月中旬正式发布代号为“Emerald Rapids”的面向数据中心的第五代 Xeon系列处理器。 近日,国外网友@InstLatX64 提前曝光了“Emerald Rapids”的详细信息。 另外,第五代 Emerald Rapids CPU已经由第四代 Sapphire Rapids 中的 4-tile 设计转变为 2-tile 设计。 Sapphire Rapids) 56 核 CPU 进行了比较。 与此同时,英特尔第五代 Emerald Rapids CPU 预计将于12 月 14 日推出。 编辑:芯智讯-浪客剑

    1.3K10编辑于 2023-12-12
  • 来自专栏GPUS开发者

    CUDA Python的「黄金三角」:PyTorch+RAPIDS+CuPy如何重构科学计算

    接下来我要提到的第二个核心入口点,相信很多人已经有所耳闻——RAPIDS。这是NVIDIA推出的开源SDK套件,包含一系列专为数据科学和机器学习设计的软件库与API。 RAPIDS生态的最大亮点在于其API的高度兼容性: 如果你熟悉NumPy,可以直接使用CuPy(GPU加速的数组计算库) 如果你习惯Pandas,可以无缝切换到cuDF(GPU版DataFrame) 从技术架构上看,CUDA数组接口(基于NumPy数组接口规范)被广泛支持: 跨框架兼容:Numba、PyTorch、PyArrow、JAX以及RAPIDS套件(cuDF、cuML等)均遵循此接口 统一内存模型 因为: -它延续了NumPy的API习惯,学习曲线平缓 -能快速验证算法在GPU上的可行性 -与其他GPU框架(如RAPIDS)的集成非常顺滑 当然,通往成功的道路有很多条。 从CuPy开始逐层向下深入: 上层框架(如RAPIDS或PyTorch)的演讲资料已有很多,它们提供更高级的抽象接口,开发者几乎无需关心硬件细节。

    57510编辑于 2025-04-18
  • 来自专栏相约机器人

    GPU加速数据分析和机器学习

    在本文中将首先介绍NVIDIA开源Python RAPIDS库,然后将提供RAPIDS如何将数据分析加速多达50次的实际演示。 图2:RAPIDS架构[3] 示范 现在展示与使用Pandas和Sklearn相比,使用RAPIDS如何能够实现更快的数据分析。 RAPIDS 为了将XGBoost与RAPIDS一起使用,首先需要以矩阵形式转换Training / Tests输入。 rapids_pred = clf.predict(dtest) rapids_pred = np.round(rapids_pred) rapids_acc = round(accuracy_score (y_test, rapids_pred), 2) print("XGB accuracy using RAPIDS:", rapids_acc*100, '%') 使用RAPIDS的模型的总体准确度等于

    1.6K30发布于 2019-07-30
  • 来自专栏大数据杂货铺

    从 CPU 切换到 GPU 进行纽约出租车票价预测

    NVIDIA RAPIDS 是一套软件库,可让您完全在 GPU 上运行端到端数据科学工作流。 RAPIDS 依靠 NVIDIA CUDA 原语进行低级计算优化,但通过用户友好的 Python 界面展现了高性能。 CML 和 NVIDIA 共同提供RAPIDS 版机器学习运行时。 RAPIDS 版运行时建立在社区构建的 RAPIDS docker 映像之上,使数据科学家只需单击一下按钮即可在 GPU 上启动和运行,他们需要的所有资源和库都触手可及。原因2得以解决。 为此,让我们探索 RAPIDS 提供的 Python 接口。 NVIDIA 声称 RAPIDS Python 界面是用户友好的。 最重要的是,只需切换到 RAPIDS 库并更改几行代码即可。

    2.8K20编辑于 2021-12-08
  • 来自专栏自学气象人

    让python快到飞起 | 什么是 DASK ?

    以下是 NVIDIA 使用 Dask 正在进行的许多项目和协作中的几个: | RAPIDS RAPIDS 是一套开源软件库和 API,用于完全在 GPU 上执行数据科学流程,通常可以将训练时间从几天缩短至几分钟 NVTabular 能够利用 RAPIDS 和 Dask 扩展至数千个 GPU ,消除等待 ETL 进程完成这一瓶颈。 DASK + RAPIDS:在企业中实现创新 许多公司正在同时采用 Dask 和 RAPIDS 来扩展某些重要的业务。 NVIDIA 的一些大型合作伙伴都是各自行业的领导者,他们正在使用 Dask 和 RAPIDS 来为数据分析提供支持。 他们公开托管的托管部署产品为同时使用 Dask 和 RAPIDS 提供了一种强大而直观的方式。

    5.2K123编辑于 2022-11-02
  • 来自专栏小白实例

    【玩转GPU】基于GPU云服务器实现MySQL数据库加速

    摘要:本文通过在GPU云服务器上部署和配置MySQL数据库,并使用RAPIDS GPU数据处理库进行加速,来详细阐述如何利用GPU强大的并行计算能力,加速MySQL数据库的查询和分析操作,使其比传统CPU 并初始化GPU环境RAPIDS是NVIDIA开源的GPU加速数据处理库。 安装RAPIDS:#安装RAPIDS依赖yum install -y python3 gcc-c++#安装RAPIDS库conda install -c nvidia -c rapidsai -c numba -c conda-forge \rapids-blazing=21.08 python=3.7 cudatoolkit=10.2然后我们需要初始化RAPIDS用于识别GPU:pythonimport 九、总结本文详细演示了如何在GPU云服务器上部署MySQL数据库,并使用RAPIDS等库实现GPU加速。GPU通过强大的并行计算能力,可以极大优化数据库查询、运算和分析性能。

    4.4K12编辑于 2023-07-19
  • 来自专栏芯智讯

    英特尔公布至强处理器路线图:两年四代产品,144核、Intel 18A都有!

    在今年年初,英特尔就发布了代号为Sapphire Rapids的第四代至强可扩展平台。接下来,在今年四季度,英特尔将会发布第五代的至强可扩展平台Emerald Rapids。 随后,英特尔还将推出基于Intel 3工艺,但均为P大核的至强平台Granite Rapids。 根据英特尔公布的数据显示,第四代至强Sapphire Rapids虽然有些姗姗来迟,但它已经赢得了450多款系统设计,创下历史新高。 至于2024年即将推出的Sierra Forest和Granite Rapids。 值得一提的是,Granite Rapids在内存、I/O上有创新突破,尤其是内存将支持到DDR5-8800 MCR RIDMM,最高带宽达到惊人的1.5TB/s,比现在提升83%。

    1.3K10编辑于 2023-04-11
  • 来自专栏芯智讯

    英特尔Granite Rapids Xeon CPU缓存容量将提升至480MB,比上一代高出50%

    1月22日消息,据外媒报道,英特尔第六代 Granite Rapids Xeon CPU的缓存容量将会进一步提升至480MB,相比不久前发布的第五代Emerald Rapids Xeon CPU提高50% 在此前的英特尔第五代 Emerald Rapids Xeon CPU上,其缓存容量相比上一代提升了3倍,直接从105 MB跃升至320MB。 根据SDE 9.33.0(软件开发模拟器)更新中的最新条目显示,即将于2024年上半年发布的第六代 Granite Rapids Xeon CPU将会配备高达480 MB 的 L3 缓存,这是一个巨大的增长 Granite Rapids 是否会使用该技术还有待观察,但 AMD 目前具有优势,并且为那些喜欢采用更高缓存路线的客户提供了解决方案。 Granite Rapids Xeon CPU 将与 AMD计划于今年发布的基于 Zen 5 核心架构的 EPYC Turin 芯片竞争。

    31810编辑于 2024-01-23
  • 来自专栏机器之心

    Chiplet设计、性能240%提升,英特尔下一代数据中心CPU设计来了

    接下来看 Granite Rapids 和 Sierra Forest 这两款数据中心芯片的具体细节。 同时,Granite Rapids 也采用相同的 Intel 3 工艺。 同时对于 Granite Rapids,我们有 Redwood Cove P 核心。 Granite Rapids 的 Redwood Cove 将支持 2048 个 256 位内存 key,而 Sapphire Rapids 则支持 128 个 key。 Granite Rapids 芯片将提供比 Sapphire Rapids 更多的 CPU 内核(SPR XCC 为 60 个)。当然,Sierra 的 144 个内核将提供更多的 CPU 内核。

    70740编辑于 2023-09-08
  • 来自专栏相约机器人

    如何通过Maingear的新型Data Science PC将NVIDIA GPU用于机器学习

    但是,如果因为不使用深度学习而感到被淘汰,那段日子已经过去了:有了RAPIDS库套件,现在可以完全在GPU上运行数据科学和分析管道。 https://developer.nvidia.com/rapids 在本文中,将讨论其中的一些RAPIDS库,并进一步了解Maingear的新型Data Science PC。 现在,借助RAPIDS库套件,还可以操纵数据帧并在GPU上运行机器学习算法。 快速 RAPIDS是一套开放源代码库,可与流行的数据科学库和工作流集成在一起以加快机器学习的速度[3]。 一些RAPIDS项目包括cuDF(类似于Pandas的数据框操作库)。 使用cuDF更快地加载1GB CSV 5倍 cuML:机器学习算法 cuML与其他RAPIDS项目集成,以实现机器学习算法和数学基元函数。

    2.4K40发布于 2019-10-31
领券