搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏青玉伏案
iOS逆向工程之Hopper中的ARM指令
当然本篇所涉及的ARM指令集是冰山一角，不过也算是基础，可以阅读Hopper中的汇编了，实践出真知，看多了自然而然的就会了。当你使用Hopper进行反编译时，里边全是ARM的指令，那是看的一个爽呢。下面就是使用Hopper打开MobileNote.app的一个Hopper的界面。 Hopper的功能是非常强大的，在Hopper中你可以对ARM指令进行修改，并且生成一个新的可执行文件。当然Hopper强大的功能可以帮助你更好的理解ARM汇编语言的业务逻辑，Hopper会根据ARM汇编生成相关的逻辑图，如下所示。从下方的逻辑图中你就能清楚的看到相关ARM汇编的指令逻辑。 Hopper的功能强大到可以将ARM汇编生成相应的伪代码，如果你看ARM指令不直观的话，那么伪代码对你来说会更好一些。下方就是Hopper根据ARM指令生成的伪代码，如下所示。 ?
1.7K70发布于 2018-01-11
来自专栏娱乐心理测试
使用class-dump 和Hopper实现简单反编译
一、Hopper Hopper Disassembler是Mac上的一款二进制反汇编器，基本上满足了工作上的反汇编的需要，包括伪代码以及控制流图(Control Flow Graph)，支持ARM指令集并针对 1.打开下载后的Hopper ? 2.打开上面归档的 /Payload 目录下的.app 文件，显示包内容，找到二进制文件 ? 3.将二进制文件拖到Hopper中 ?
4.9K20发布于 2019-05-13
来自专栏IT技术订阅
英伟达的Ampere架构和Hopper架构技术解析
英伟达的Ampere架构和Hopper架构分别代表了该公司在GPU设计上的两个重要里程碑，两者在性能、能效、以及针对不同应用场景的支持上都有显著的进步和差异。 Hopper架构英伟达的Hopper架构是一项重大的技术创新，专为加速计算而设计，旨在满足从小型企业到百亿亿次级高性能计算（HPC）和万亿参数规模的人工智能（AI）等各类工作负载的需求。发布时间：Hopper架构在2022年正式推出，以美国计算机科学家Grace Hopper命名，标志着英伟达GPU设计的又一次重大革新，主要针对数据中心和高性能计算市场。 Hopper架构技术原理解析： 1. 安全性和可扩展性 Hopper架构强调安全性，内置了多项安全特性，确保数据在传输和处理过程中的安全。
2.3K10编辑于 2024-06-18
来自专栏青玉伏案
iOS逆向工程之Hopper+LLDB调试第三方App
LLDB与Hopper的结合，会让你看到不一样的东西，本篇博客就会和你一起领略LLDB与Hopper的魅力。四、Hopper + LLDB 在上篇博客《iOS逆向工程之给WeChat脱壳》我们已经给微信进行可脱壳处理，所以使用Hopper进行处理是没有问题的。从Hopper中我们可以知道：模块偏移前的基地址=0x4000 ? 所以从Hopper到LLDB，我们要做一个地址偏移量的转换。这个在下方会多次用到。那么寻找上述视图控制器的内存地址的任务就交给了我们的Hopper来做了。
2.7K90发布于 2018-01-11
来自专栏新智元
英伟达架构师团队撰文详解：Hopper为啥这么牛？
在英伟达GTC 2022大会上，老黄更新了服役近两年的安培微架构（Ampere），推出Hopper架构，并抛出一块专为超算设计、包含800亿个晶体管的显卡Hopper H100，比老前辈A100显卡的540 但光看名字和参数还不够，Hopper到底牛在哪？最近英伟达的架构开发师们发布了一篇博客，深入讲解和分析了Hopper架构。 Hopper牛在哪？ Hopper架构的名字来自Grace Hopper女士，她被誉为计算机软件工程第一夫人、编译语言COBOL之母，她是耶鲁大学第一位数学女博士、世界上第三位程序员、全球首个编译器的发明者，也是第一位发现「基于Hopper架构的英伟达Hopper H100张量核心GPU已经是第九代数据中心GPU了，相比上一代安培架构的A100 GPU，Hopper架构明显强悍了很多，不仅晶体管数量有明显提升，制作工艺也从
1.2K20编辑于 2022-04-06
来自专栏镁客网
【每日要闻】英伟达下一代H100 Hopper显卡遭曝光；钉钉推出下班勿扰模式
1、英伟达下一代H100 Hopper显卡遭曝光：基于台积电5nm的性能怪兽 2、钉钉推出下班勿扰模式：开启后手机将不再接收单聊、群聊等消息通知 3、罗永浩辟谣“下个月还清债务”：还清后会主动官宣 4、 Series 3可能在第三季度生命周期终止 9、SpaceX：星链已有25万用户，将颠覆民航机舱上网市场 10、联发科打入三星供应链，消息称A系列新机将采用天玑9000芯片 1、英伟达下一代H100 Hopper 显卡遭曝光：基于台积电5nm的性能怪兽今日消息，Videocardz又一次在NVIDIA GTC前夕泄露了即将推出的Hopper H100 GPU的全部内容。从曝光内容可以看到，英伟达新一代Hopper H100 GPU仍是一个巨大的单片结构，因此打破了网上关于新一代显卡采用MCM设计的猜测，并且可以由此计算得出144个单独的流式多处理器(SM)。
63230编辑于 2022-03-25
来自专栏新智元
均价300万美元？英伟达GH200超级芯片落地9个超算中心，每秒两百亿亿次flop
英伟达用Grace Hopper的实力证明，它可以成为AI超算的首选硬件，未来将不再局限于GPU。英伟达Grace Hopper超级芯片架构是第一个真正的异构加速平台，将Hopper GPU的高性能和Grace CPU的多功能性融合在单个芯片中，专为加速计算和生成式AI而打造。相比AMD所使用的HBM3内存，HBM3e提速约50%，将Grace Hopper中的数据传输速率从原来的4TB/s提升到5TB/s。除了Grace Hopper系列，英伟达也在雄心勃勃地扩展更多的产品线，以满足不同层次、不同场景的计算需求。加速AI驱动的科学研究英伟达对基于Grace Hopper的超算中心寄予厚望，认为此举将加速科学研究进程。
95310编辑于 2024-05-22
来自专栏新智元
1000亿晶体管 MCM封装，NVIDIA首个5nm制程GPU又要横扫江湖？
这使得Ampere架构成为了NVIDIA旗下的一代经典，而最近，关于它的继任者Hopper系列也是传言不断。 Hopper：性能要达到Ampere的三倍！而Hopper则是源自计算机科学家Grace Hopper，她被誉为“COBOL 之母”，也是Bug一词的发明者，是世界上最早的一批程序员。 ? 之前说迫于AMD 7纳米制程navi系列显卡的压力，NVIDIA将于今年提前推出Hopper系列GPU。而基于Hopper架构的GPU将于明年推出。 Hopper也将成为NVIDIA的首款MCM多芯封装的GPU，与Intel的Xe-HPC以及AMD的CDNA2同场竞技。 ?
69830发布于 2021-07-29
来自专栏GPUS开发者
看懂NVIDIA GPU的SM后缀：sm_90、sm90a、sm_100f核心差异解析
但从Hopper、Blackwell架构开始，NVIDIA彻底改写了这套规则，sm后缀不再是装饰性元数据，而是GPU二进制程序的核心运行契约。二、Hopper架构革新：拆分出sm_90与sm_90a双版本到了9代Hopper架构，NVIDIA首次打破一对一映射规则，将原本单一的sm_90拆分为通用基线版sm_90和架构专属版sm_90a，二者绝非简单的版本微调 1. sm_90：高兼容的Hopper通用基线 sm_90是Hopper架构的通用基线版本，主打最大向前兼容性。该模式下，编译器只会生成通用、标准化的指令集，适配Hopper架构的基础能力。指定sm_90a编译时，PTX汇编器可以生成仅Hopper硬件能识别、执行的专属指令，解锁架构全部高级特性，充分释放硬件极致性能。五、快速选型总结与开发建议为方便开发者快速选型，核心差异与适用场景一目了然： sm_90：Hopper通用基线，高向前兼容，适配通用场景，追求程序稳定复用 sm_90a：Hopper满血专属，无向前兼容
13210编辑于 2026-06-09
DeepSeek开源周首日放大招，我和它进行了一次“深度思考”的采访
“放大招”我：在今天开源第一日就推出了FlashMLA，是专为英伟达Hopper GPU打造MLA解码内核，并且被网友称为是在“放大招”，对此你怎么看？以下从技术、战略和行业影响三个维度展开分析：一、技术维度：直击大模型推理的核心痛点1.为何选择Hopper GPU？ Hopper架构（如H100）的Transformer引擎和FP8精度支持，使其成为大模型推理的黄金硬件。二、战略维度：开源背后的生态博弈抢占Hopper生态先机英伟达Hopper GPU正在成为AI训练/推理的“新基建”，但软件生态仍被NVIDIA自身库（如cuDNN、TensorRT）垄断。极致的计算效率：Hopper GPU 的「完全体」释放硬件特性深度适配FlashMLA 充分利用 Hopper 架构的 FP8 精度支持和 Transformer 引擎，将大语言模型（LLM）推理中的矩阵计算效率推向极限
54010编辑于 2025-02-24
来自专栏GPUS开发者
CUDA Toolkit 11.8 新功能揭晓
NVIDIA Hopper 和 Ada Lovelace 中特定于架构的新功能最初是通过库和框架增强功能公开的。 NVIDIA Hopper 架构的完整编程模型增强功能将从 CUDA Toolkit 12 系列开始发布。 CUDA 11.8 有几个重要的特性。这篇文章提供了关键功能的概述。支持NVIDIA Hopper 和 NVIDIA Ada 架构 CUDA 应用程序可以立即受益于新 GPU 系列中增加的流式多处理器 (SM) 数量、更高的内存带宽和更高的时钟频率。 CUDA 11.8 中引入了新的计算功能，以帮助在 NVIDIA Hopper 架构上进行性能调整活动。您现在可以分析和调试 NVIDIA Hopper 线程块集群，从而提高性能并增强对 GPU 的控制。
2.7K30编辑于 2022-10-08
来自专栏CreateAMind
coach 模块化最好的强化学习框架
HalfCheetah_ClippedPPO_Roboschool HalfCheetah_DDPG HopperBullet_A3C HopperIceWall_A3C HopperStairs_A3C Hopper_A3C Hopper_ClippedPPO Hopper_ClippedPPO_Distributed Hopper_ClippedPPO_Roboschool Hopper_DDDPG Hopper_DDPG Hopper_DDPG_Roboschool Hopper_DPPO Hopper_NAF Hopper_PPO Hopper_PPO_Roboschool Humanoid_A3C Humanoid_ClippedPPO
51720发布于 2018-07-20
来自专栏SDNLAB
各花入各眼，一文看尽英伟达GTC 2022
Hopper 和 Grace 大型语言模型（LLM）和推荐系统是当今最重要的两个AI模型。 Hopper是一款新的数据中心 GPU，在训练 Transformer 网络时性能提升了五倍。英伟达将 Hopper GPU 定位为一个突破口，可以降低训练这些大型模型的高昂成本。黄仁勋宣布 Hopper 现已投入生产，PCIe 版本将在下个月交付给戴尔、HPE、Supermicro、思科和联想等合作伙伴。他还指出，与当今的 CPU-GPU 配置相比，Grace-Hopper 超级芯片将提供 7 倍的快速内存容量 (4.6TB) 和 8000 TFLOPS，包含 Grace Hopper 的系统将于 2023 为此，英伟达推出了 DRIVE Thor，它结合了 Hopper 变压器引擎、Ada GPU 和 Grace CPU。
1.2K20编辑于 2022-09-22
来自专栏新智元
碾压H100！英伟达GH200超级芯片首秀MLPerf v3.1，性能跃升17%
其中，最新发布的GH200 Grace Hopper超级芯片，也是首次在MLPerf Inference 3.1上亮相。英伟达GH200 Grace Hopper超级芯片专为计算密集型工作负载而设计，能够满足各种严苛的要求和各项功能。 NVIDIA Grace Hopper MLPerf Inference数据中心性能与DGX H100 SXM的对比结果，每个数值都是GH200的性能领先幅度 GH200 Grace Hopper超级芯片集成了 GH200 Grace Hopper超级芯片在Hopper GPU和Grace CPU之间的高带宽NVLink-C2C连接可以实现CPU和GPU之间的快速通信，从而有助于提高性能。使用了NVLink-C2C的GH200 Grace Hopper超级芯片仅使用3%的推理时间就完成了相同的传输。
58230编辑于 2023-09-19
来自专栏京程一灯
分分钟让你在微信运动霸占榜首
Hopper Disassembler v3 下面是官网的原话： Hopper is a reverse engineering tool for OS X and Linux, that lets you 简单的说就是 Hopper 是一个反编译工具。可能还有一些类似的工具比如说IDA。因为免费版功能不全，完整版太贵，这里毫不犹豫选择了Hopper。先打开Hopper。 Hopper 不难发现，函数已经找到了， [XMUser isVIP] 我们可以通过右上角按钮查看方法的伪代码. 通过Hopper 修改微信步数首先我们要找到WeChat.app ，我们可以通过解压工具在WeChat.ipa/Payload/找到并解压出来。 ?
2.4K10发布于 2019-03-28
来自专栏AIGC新知
DeepSeek开源FlashMLA，从GPU架构进行优化开始......
FlashMLA 是 DeepSeek 开源的针对 NVIDIA Hopper 架构 GPU 优化的高效 MLA（Multi-Head Linear Attention）解码内核，专为处理可变长度序列设计它结合了 FlashAttention 的高效内存管理和并行化策略，以及 CUTLASS 的底层优化和架构支持，从而在 Hopper 架构上实现了高效的多头注意力解码。 FlashAttention-2 和 FlashAttention-3 的并行化和工作分配策略为 FlashMLA 提供了优化思路，使其能够在 Hopper 架构上实现高效的计算。架构支持：CUTLASS 对多种 NVIDIA GPU 架构的支持为 FlashMLA 提供了硬件适配的基础，使其能够针对 Hopper 架构进行优化。 FlashMLA 需要以下硬件和软件环境：硬件：NVIDIA Hopper 架构 GPU（例如 H800 SXM5）。软件：CUDA 12.3 及以上版本；PyTorch 2.0 及以上版本。
46110编辑于 2025-02-26
来自专栏极客生活
macOS扫雷逆向破解
Hopper 跨平台的反汇编静态分析工具。 OK，这两个第三方工具已经可以了。黑暗森林先来看「安全帽」的破解思路。下一步就是使用Hopper打开扫雷程序，在Hopper中搜索Robot相关的符号。在-[GameState robot]中设置断点，通过Hopper debug server进行动态调试。发现rax中的返回值总是0（事先已经消耗光了默认的10个安全帽）。使用Hopper修改0x000000010006381处的指令，修改为 mov al, 0x1 nop 这样和原来的指令一样，占3个字节。「高级」功能的破解也是类似，先找到跟「高级」相关的单词expert，然后在Hopper中搜索expert，找到方法-[minesweepermacAppDelegate startNewGameExpert
1.7K20发布于 2018-08-28
来自专栏6G
对于英伟达的 GH200 ，你可能有些误解！
NVIDIA Grace Hopper 和 NVIDIA Grace 超级芯片而在底部，同样有 LPDDR5X 封装，使得每个 CPU 总共拥有 16 个内存封装。技嘉 H223 V10 2U4N NVIDIA Grace Hopper 节点 GH100 96GB 版本则包括了在封装周围可以看到的全部六个堆栈。当我们说 GH200 时，Hopper 端可以是 96GB H100 HBM3 GPU 或 144GB（141GB）HBM3e H200 GPU 。最后回顾一下，当有人提到 GH200 时，除了有 Arm Neoverse V2 内核和 NVIDIA Hopper GPU 这些事实外，它的含义还存在一些巨大的差异。因此，当我们所讨论的当我们讨论 NVIDIA Grace Hopper 时，明确它的版本是非常重要的。感谢阅读！
99110编辑于 2024-09-14
来自专栏CreateAMind
coach 模块化最好的强化学习框架
HalfCheetah_ClippedPPO_Roboschool HalfCheetah_DDPG HopperBullet_A3C HopperIceWall_A3C HopperStairs_A3C Hopper_A3C Hopper_ClippedPPO Hopper_ClippedPPO_Distributed Hopper_ClippedPPO_Roboschool Hopper_DDDPG Hopper_DDPG Hopper_DDPG_Roboschool Hopper_DPPO Hopper_NAF Hopper_PPO Hopper_PPO_Roboschool Humanoid_A3C Humanoid_ClippedPPO
66140发布于 2018-07-20
来自专栏深度学习与python
囤 H100 的都成了大冤种！英伟达发布最新 AI 芯片 H200：性能提升 2 倍，成本下降 50%
据英伟达官网消息，基于英伟达的“Hopper”架构，H200 是该公司首款采用 HBM3e 内存的芯片。这种内存速度更快、容量更大，使其更适用于大语言模型。相信过去一年来花大价钱购买过 Hopper H100 加速器的朋友都会为自己的冲动而后悔。为了防止囤积了大量 H100 的客户们当场掀杆而起，英伟达似乎只有一种办法：把配备 141 GB HBM3e 内存 Hopper 的价格，定为 80 GB 或 96 GB HBM3 内存版本的 1.5 很明显，英伟达也必须顺应这波趋势，至少也要为 Hopper GPU 配备更大的内存。最后：H200 GPU 加速器和 Grace-Hopper 超级芯片将采用更新的 Hopper GPU，配备更大、更快的内存，且计划于明年年中正式上市。
79310编辑于 2023-11-18

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

iOS逆向工程之Hopper中的ARM指令

使用class-dump 和Hopper实现简单反编译

英伟达的Ampere架构和Hopper架构技术解析

iOS逆向工程之Hopper+LLDB调试第三方App

英伟达架构师团队撰文详解：Hopper为啥这么牛？

【每日要闻】英伟达下一代H100 Hopper显卡遭曝光；钉钉推出下班勿扰模式

均价300万美元？英伟达GH200超级芯片落地9个超算中心，每秒两百亿亿次flop

1000亿晶体管 MCM封装，NVIDIA首个5nm制程GPU又要横扫江湖？

看懂NVIDIA GPU的SM后缀：sm_90、sm90a、sm_100f核心差异解析

DeepSeek开源周首日放大招，我和它进行了一次“深度思考”的采访

CUDA Toolkit 11.8 新功能揭晓

coach 模块化最好的强化学习框架

各花入各眼，一文看尽英伟达GTC 2022

碾压H100！英伟达GH200超级芯片首秀MLPerf v3.1，性能跃升17%

分分钟让你在微信运动霸占榜首

DeepSeek开源FlashMLA，从GPU架构进行优化开始......

macOS扫雷逆向破解

对于英伟达的 GH200 ，你可能有些误解！

coach 模块化最好的强化学习框架

囤 H100 的都成了大冤种！英伟达发布最新 AI 芯片 H200：性能提升 2 倍，成本下降 50%

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

iOS逆向工程之Hopper中的ARM指令

使用class-dump 和Hopper实现简单反编译

英伟达的Ampere架构和Hopper架构技术解析

iOS逆向工程之Hopper+LLDB调试第三方App

英伟达架构师团队撰文详解：Hopper为啥这么牛？

【每日要闻】英伟达下一代H100 Hopper显卡遭曝光；钉钉推出下班勿扰模式

均价300万美元？英伟达GH200超级芯片落地9个超算中心，每秒两百亿亿次flop

1000亿晶体管 MCM封装，NVIDIA首个5nm制程GPU又要横扫江湖？

看懂NVIDIA GPU的SM后缀：sm_90、sm90a、sm_100f核心差异解析

DeepSeek开源周首日放大招，我和它进行了一次“深度思考”的采访

CUDA Toolkit 11.8 新功能揭晓

coach 模块化最好的强化学习框架

各花入各眼，一文看尽英伟达GTC 2022

碾压H100！英伟达GH200超级芯片首秀MLPerf v3.1，性能跃升17%

分分钟让你在 微信运动 霸占榜首

DeepSeek开源FlashMLA，从GPU架构进行优化开始......

macOS扫雷逆向破解

对于英伟达的 GH200 ，你可能有些误解 ！

coach 模块化最好的强化学习框架

囤 H100 的都成了大冤种！英伟达发布最新 AI 芯片 H200：性能提升 2 倍，成本下降 50%

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

分分钟让你在微信运动霸占榜首

对于英伟达的 GH200 ，你可能有些误解！