首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏GPUS开发者

    NVIDIA发布全新OpenACC工具套件

    为了让更多的研究人员享受到这一好处,NVIDIA宣布推出全新的OpenACC工具套件,它是一套免费的多合一OpenACC并行编程工具。 学术界免费使用 此次发布的OpenACC工具套件将让用户更快地实现OpenACC入门。如果你是一名研究人员,那么它几乎可以提供你所需的一切,让你能够快速而轻松地对GPU进行编程。 全新的OpenACC工具套件包含行业领先、用于Linux系统的PGI加速器Fortran/C语言工作站编译器套装软件,该软件支持OpenACC 2.0标准。 全新的OpenACC工具套件还包括NVProf Profiler工具,它可指导用户在哪里添加 OpenACC“指令”或简单的编译器提示,以加速代码。另外它还包含真实的代码实例来帮助用户快速入门。 OpenACC的一大主要特性是高性能移植,而PGI OpenACC编译器则把这一优势推向全新高度。该编译器首次能够在x86多核CPU和GPU上加速OpenACC代码。

    1.5K50发布于 2018-03-30
  • 来自专栏GPUS开发者

    OpenACC编译器也有免费午餐吃了!

    PGI Community Edition是最近发布的PGI Fortran,C和c++编译器(支持多核cpu和NVIDIA gpu)的免费许可证版本,,包括所有OpenACC,OpenMP和CUDA 是的,OpenACC和CUDA GPU Fortran功能相当于PGI付费的编译器和工具。 ---- 是否PGI Community Edition也支持OpenACC多核cpu和OpenMP吗? 是的,跟PGI收费编译器的OpenACC多核cpu和OpenMP功能一样的。 ---- PGI Community Edition编译器有限制CPU处理器的数量或所使用的核心么? 没有。

    2.8K70发布于 2018-04-02
  • 来自专栏GPUS开发者

    OpenACC帮助天体物理研究人员洞悉暗能量

    雅各布斯精通Open-MP、MPI和OpenACCOpenACC是一种导语 式加速器编程模型,目标用户是那些非全职开发 软件的科学家、工程师以及其它领域的专家。 这就是我们为何偏爱OpenACC。” “我们系统中的主要工作量通常可以表示为 空间单个格点上的独立循环,因此大部分并 行都是用OpenMP导语加速这些循环”,卡茨 说。 解决方案 该团队选择使用PGI的OpenACC编译器,PGI公 司走在OpenACC开发的前列。卡茨从向量化关 键模块之一开始——“状态方程”模块——该模块 的任务是逐点计算热力学属性。 “学习如何高效 使用OpenACC导语和将该模块向量化花费两周 时间。还需要投入一两周时间调整代码,以便我 们可以实现、使用通信更加友好的重力求解器, 然后将它在GPU上加速。” “我现在忙着重构CASTRO中的代码,以便在用 OpenACC加速时能直观一些”,卡茨说。“只完成 了针对GPU加速的第一步,我们团队正在重构代 码的第二部分,最终目标是在GPU上加速全部代 码。”

    1.2K80发布于 2018-03-30
  • 来自专栏GPUS开发者

    PGI OpenACC 2018版:原来你是这样的编译器

    PGI编译器已经全面支持OpenACC(NVIDIA发布全新OpenACC工具套件)。 实际上Lady姐认为到目前为止,PGI由于有了NVIDIA加持(NVIDIA多年前就收购了PGI),也是目前支持OpenACC最好的编译器。 ? 什么是OpenACC? 全面支持OpenACC2.6 现在所有的PGI编译器现在都支持Tesla gpu和多核cpu上的最新OpenACC特性。 OpenACC编程。 ,OpenACC区域将卸载并在GPU上执行。

    3.9K70发布于 2018-04-02
  • 来自专栏GPUS开发者

    OpenPower来了,我的代码怎么办?

    OpenACC 增加对OpenPOWER的支持 在ISC(国际超算会议)上展现实力之前,OpenACC标准集团就已经宣布了其首个OpenPOWER工具。 OpenACC的技术主管Michael Wolfe说,PGI OpenACC 编译器对于 OpenPOWER 的支持取得了稳定的进步,目前正处于非公开的beta测试阶段,正计划在八月开始公开beta测试 什么是OpenACC OpenACC是一种用于并行计算的,由Cray, Nvidia 和 PGI开发的基于指令的编程标准。该标准的设计目的是简化 异构CPU/GPU 系统的并行计算。 即将到来的、具有 OpenPOWER 功能的PGI OpenACC 编译器版本将具有以下特点: 与Linux/x86+Tesla平台上的PGI 编译器具有相同的特点 CUDA Fortran、OpenACC Wolfe 预计OpenACC编译器应当不会有大的兼容问题。

    1.9K70发布于 2018-03-30
  • 来自专栏GPUS开发者

    PGI 2014 编译器即日起提供试用,可支持AMD GPU和APU

    为针对高效能运算,并加入全新效能及简易程序功能,并行计算编译器与开发工具 PGI 即日起推出全新 PGI 2014 编译器,新版本针对 NVIDIA 和 AMD GPU 加速器加入 OpenACC 2.0 功能,为多核心 x64 提供效能增益,其中包括 NVIDIA Tesla K40 GPU 加速器,也是 OpenACC 首次支援 AMD Radeon GPU 和 APU 。 新功能方面,透过 Fortran 2003 、 C99 和 C++ 编译器扩大支援主要的 OpenACC 2.0 功能,提供例行指令 ( 在加速器区域内的程序指令 ) 、非结构性资料生命周期和更多其他功能 AMD 全球副总裁暨服务器事业总经理 Suresh Gopalakrishnan 则表示, PGI 从 AMD 支援 OpenACC 的独立式 GPU 和 APU 中能发挥极致效能,将有助排除加速器广泛普及的许多障碍

    1.6K90发布于 2018-03-30
  • 来自专栏GPUS开发者

    一项为期5天的面向高端GPU用户的专业培训活动即将开始

    OpenACC GPU Hackathon是一项为期5天的面向高端GPU用户的专业培训活动,参加活动的队伍(3-5名队员)带着由自己开发的HPC应用代码过来参加,目标是在5天的活动里,将应用通过OpenACC 每个队伍将会配备2位具有丰富经验的GPU并行化工程师作为现场导师,在5天的过程中,导师将现场手把手指导学院使用OpenACC或者CUDA帮助学员移植并优化代码。 今年夏天(8月20-24日),上海交大高性能计算中心将举办国内首场OpenACC GPU Hackathon活动,该活动旨在普及面向GPU并行程序开发的OpenACC技术,提升广大用户在GPU应用移植领域的水平

    36230发布于 2018-08-01
  • 来自专栏全栈程序员必看

    nvprof –help

    Note: if the OpenACC profiling interface is available depends on the OpenACC runtime. --openacc-summary-mode <mode> Set how durations are computed in the OpenACC summary. --print-openacc-constructs Include parent construct names in OpenACC profile. --print-openacc-summary Print a summary of the OpenACC profile. --print-openacc-trace Print a trace of the OpenACC profile.

    92420编辑于 2022-08-18
  • 来自专栏GPUS开发者

    对于CUDA Fortran开发者来说,函数传参真这么麻烦么?

    因此,至于openACC支不支持用common传数据、怎么传、结果不正确一概不予回答。 其次,至于你的问题,可以用module数据块的形式共享数据。 此模型应该满足你的需求,也应该满足大部分openacc fortran程序的需求。 大神总结 ?

    1K60发布于 2018-04-02
  • 来自专栏气象杂货铺

    支持GPU的社区版WRF模式

    WRFg是利用GPU加速的社区版中小尺度WRF模式,包含了完整的WRF动力核及一些微物理选项,可以利用GPU、OpenACC和CUDA加速WRF模式的运行。

    3.4K20发布于 2020-05-19
  • 来自专栏GPUS开发者

    蓝宝 PGS AMD FirePro S9170 服务器加速卡发布

    按照 AMD 的路线图,支持蓝宝 PGS FirePro S9170 实现 OpenACC 和 OpenMP 的工具包也将会在本季度推出,敬请大家密切留意。

    94350发布于 2018-03-30
  • 来自专栏GPUS开发者

    Allinea宣布支持CUDA 7

    从而来衡量GPU的利用率,而不会影响性能,”Allinea产品管理副总裁马克·奥康纳说:“我们的用户可以看到每一行源代码花费的时间,利用调试器找出单个内核的瓶颈来理解和修复错误,从而写出高效的CUDA和OpenACC

    67250发布于 2018-03-30
  • 来自专栏量子位

    英伟达联手Arm CPU打造AI超算,百万兆级性能,主攻气候变化和核武建模

    其中包括了所有英伟达CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

    49710发布于 2019-06-20
  • 来自专栏python3

    使用Python写CUDA程序

    test(N) if __name__ == '__main__': main() 对比 numba使用一些指令标记某些函数进行加速(也可以使用Python编写内核函数),这一点类似于OpenACC

    2.2K31发布于 2020-01-10
  • 来自专栏黑泽君的专栏

    Eclipse各版本代号一览表以及官网上有很多版本的eclipse,下载哪个版本比较合适呢?

    10、Eclipse for Parallel Application Developers 用于 c、c++、Fortran 和 UPC 的工具, 包括 MPI、OpenMP、OpenACC、并行调试器以及远程构建

    7.3K10发布于 2018-10-11
  • 来自专栏机器之心

    想看英伟达GTC黄仁勋演讲的视频直播?请锁定机器之心官网

    60 多场实践动手培训课程将涵盖人工智能基础、自动驾驶汽车、CUDA 编程、基因组学 AI、嵌入式应用、OpenACC 和 VR 等主题。

    84960发布于 2018-05-08
  • 来自专栏GPUS开发者

    OpenCL超级计算研讨会总结

    资深软件经理陆璐博士展示基于Firepro高性能GPU计算卡的OpenCL/DNN(深度学习)技术与方案,成为众人最关注的焦点,此外吉浦迅科技CEO陈泳翰受邀介绍GPU并行计算的性价比、节能等特色,以及OpenCL+OpenACC

    1K90发布于 2018-03-30
  • 来自专栏GPUS开发者

    DAY 1: 学习CUDA C Programming Guide

    programming interfaces, or directives-based approaches are supported, such as FORTRAN, DirectCompute, OpenACC

    2.6K42发布于 2018-06-25
  • 来自专栏自然语言处理

    贷款违约预测-Task2 数据分析

    purpose', 'postCode', 'regionCode', 'dti', 'delinquency_2years', 'ficoRangeLow', 'ficoRangeHigh', 'openAcc 借款人过去2年信用档案中逾期30天以上的违约事件数 ficoRangeLow 借款人在贷款发放时的fico所属的下限范围 ficoRangeHigh 借款人在贷款发放时的fico所属的上限范围 openAcc ficoRangeLow 800000 non-null float64 20 ficoRangeHigh 800000 non-null float64 21 openAcc purpose', 'postCode', 'regionCode', 'dti', 'delinquency_2years', 'ficoRangeLow', 'ficoRangeHigh', 'openAcc purpose', 'postCode', 'regionCode', 'dti', 'delinquency_2years', 'ficoRangeLow', 'ficoRangeHigh', 'openAcc

    1.5K30发布于 2020-09-22
  • 来自专栏新智元

    戈登·贝尔奖2017终选名单公布,2/3来自中国,基于神威·太湖之光

    我们在第一阶段使用OpenACC指令,以每天2.81模拟年的模拟速度,将CAM拓展到150万个核心。

    1.2K70发布于 2018-03-21
领券