国产GPU创业领域目前存在哪些问题?应该以什么样的态度发展国产GPU?与海外巨头相比,有何差距与挑战?追赶的机会在哪?集微网同产业人士进行交流,探寻国产GPU创业浪潮风起云涌的背后。 地缘政治、大国博弈背景下,相较于已有一定积累的国产CPU,国产GPU的破局更具紧迫性和必要性。人才储备程度,科创板提供的退出机制,也为国产GPU的发展创造了良好契机。 从应用角度来看,国内GPU生态的发展更需要“众人拾柴”。时昕认为,要加快打造国产GPU产业链,下游的整机厂商需要对国产GPU给予更多包容。 “国产GPU可能99%已达标了,如果能帮助国产GPU厂商一起将这百分之一影响体验的最后一步补齐,做到更完善,这对其发展是非常重要的。”时昕强调。 急功近利,疯狂招人,疯狂烧钱的模式,实际上不可能快速弥补国产GPU跟国外GPU之间的差距,因为国外的GPU是一个个应用打磨出来的,国产GPU一定要有耐心,才能够在这个领域实现创新和弯道超车。”
近日,国产GPU大厂沐曦集成电路(以下简称“沐曦”)被传在IPO上市前实施裁员计划,涉及约20%员工(约200人),以降低成本提高上市成功率。 作为国产GPU明星企业,沐曦在成立不到1年内,公司就迅速完成从天使轮到A轮的四轮融资,融资金额达数十亿。 值得一提的是,今年2月,超讯通信接连拿下了合计14.88亿元的基于沐曦曦云C500芯片方案的训推一体服务器大单,足见目前该市场对于沐曦GPU加速芯片方案的认可。 编辑:芯智讯-浪客剑
鱼羊 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 国产GPU,这波发展势头有点猛啊。 先是芯动科技在去年底推出一颗“风华1号”,剑指高性能桌面级/服务器级显卡市场。 现在摩尔线程仅用18个月时间,量产上市了一款全功能国产GPU。壁仞科技也紧跟着宣布首款通用GPU芯片点亮成功。 如此速度和成果,甚至引来外界惊叹: 这是一夕之间就杀到了老黄城墙下的节奏? 像摩尔线程、壁仞科技这样的国产GPU创业公司,还有很长的路要走。 国产GPU,为何是现在? 国产芯片创业上一轮爆发与AI热潮同步,聚焦于数据计算,也就是各类DPU、NPU。 芯动科技就把“信创”列为风华1号的主要应用方向之一,还与国产操作系统统信达成生态合作,完成国产GPU与国产OS的适配。 △摩尔线程官网 如此看来,2020年中段开始创业或立项,不到2年纷纷拿出量产或流片的成果,就是国产GPU现在的速度。
与此同时,美国对于中国半导体产业也是持续打压,推动了国内对于自主可控的高性能GPU的需求,再加上资本的助推,国内这几年已经涌现出了一大批国产GPU初创公司,比如壁仞科技、天数智芯、燧原科技、沐曦集成电路 即便是近两年重新进入独立GPU显卡市场的英特尔,发展独立显卡业务也不得从英伟达和AMD大肆挖人。 同样,很多国产GPU初创公司的核心GPU人才也主要都是来源于AMD和英伟达。 通过上面的介绍,我们不难看出,众多国产GPU厂商的核心人员更多是来自于AMD,而非英伟达。 这主要是因为,AMD在中国大陆有研发中心(英伟达则没有),也间接为中国的国产GPU产业的发展贡献了不少的人才。 虽然这并不是我们愿意看到的,但是从另一个方面来看,或许AMD此番裁员也将为国产GPU厂商贡献更多的人才。 高通明年年初还将裁员?
其是基于MUSA统一系统架构打造的数据中心级多功能GPU产品,内置图形渲染、视频编解码、人工智能加速和并行计算等功能引擎,为国产云桌面GPU虚拟化的落地创造了必要条件。 此次摩尔线程基于MTT S2000打造的全新GPU云桌面产品MT vGPU1.0、MT GPU直通和MT GPU加速协议编码,覆盖了GPU虚拟化的所有路径,其推动国产云桌面市场全面升级的决心可见一斑。 在直通模式场景,通过PCIe透传技术将一块完整的GPU芯片透传到虚拟机中,MT GPU直通支持加速渲染、视频编解码等功能场景,同时兼容Windows10、Linux等操作系统,实现国产化支持。 在发布会现场,摩尔线程的四家合作伙伴分享了基于MTT S2000打造的丰富解决方案,展示出GPU云桌面在教育、制造、办公等领域的实践成果,并对国产替代的前景颇为看好。 产品性能的迭代与商业模式的完善永无止境,国产GPU的大规模商用还有很长的路要走。vGPU1.0只是摩尔线程的新起点,但已有了“初生牛犊不怕虎”的意味。
根据官方介绍,沐曦(MetaX)致力于为异构计算提供全栈GPU芯片及解决方案,可广泛应用于人工智能、智慧城市、数据中心、云计算、自动驾驶、数字孪生、元宇宙等前沿领域。 核心成员平均拥有近20年的高性能GPU产品端到端研发经验,曾主导过十多款世界主流高性能GPU产品研发,包括GPU架构定义、GPU IP设计、GPU SoC设计、GPU系统解决方案的量产交付全流程。 结合兼容主流GPU生态的完整软件栈(MXMACA),沐曦GPU具备高能效和高通用性的天然优势,可构建软硬件一体的全面生态解决方案。 沐曦在加入openKylin后,将加入社区GPU SIG工作组,推动openKylin操作系统生态持续良好发展。 此外,沐曦将从人工智能、智慧城市、数据中心、云计算、自动驾驶、数字孪生、元宇宙等前沿领域的底层算力支撑方面,为社区生态发展及品牌建设和国产软硬件生态建设提供强力支持。
估值超110亿元,沐曦加入“国产GPU第一股”争夺 需要指出的是,目前除了沐曦之外,摩尔线程、燧原科技、壁仞科技、天数智芯等国产GPU/AI芯片厂商都在积极的推动IPO或其他途径上市。 随着摩尔线程与沐曦相继在一周内完成了备案辅导,这也意味着沐曦将与摩尔线程争夺“国产GPU第一股”。 2023年10月,美国还将国产GPU厂商壁仞科技、摩尔线程列入了实体清单。 显然,此举无疑将会影响到包括沐曦、摩尔线程、燧原科技、壁仞科技等众多国产AI/GPU芯片厂商的芯片的制造,未来只能依靠国内的芯片代工和先进封装产能。 但是在国产先进半导体设备尚未获得全面突破的背景下,目前国产先进制程产能相对有限,特别是还有华为、海光这样的能够锁定国产先进制程产能的“AI大厂”存在,对于沐曦等众多的初创AI/GPU厂商来说,对于先进制程产能的获取能力
近日,国产GPU初创企业杭州曦望芯科智能科技有限公司(简称“曦望Sunrise”)完成近10亿元融资。 曦望Sunrise是一家由商汤在2024年底分拆独立出来的国产GPU公司,专注于高性能GPU研发,定位为“更懂AI的芯片公司”。其产品线包括已经量产的曦望S1、S2和正在研发的S3。 据悉,该产品采用全新架构设计,旨在将推理计算的成本降至现有水平的1/10,挑战“让国产大模型推理成本进入1分钱时代”。 编辑:芯智讯-林子
与此同时,一个问题变得无法回避:国产GPU,够用吗?就在一两年前,行业里的普遍态度还是嫌弃——嫌国产卡性能不够、生态不行、适配麻烦,能用英伟达的绝不碰国产。但风向正在急转。 当海外高端GPU的进口通道越收越窄,当大模型训练和推理的算力需求以指数级膨胀,越来越多的人开始意识到一个尴尬的现实:你可以嫌弃国产GPU,但很快你可能连嫌弃的机会都没有——因为抢都抢不到。 一、造不出来多少7nm是入场券先说一个前提:为什么国产GPU的产能问题跟7nm制程绑死了?AI加速芯片对算力密度、功耗比和片上互联带宽的要求极高。 ——消耗着大量国产GPU产能,却无法被更广泛的企业通过云端灵活调用。 回到开头那个问题:就在不久前,很多人还觉得国产GPU是"不得已的选择"。但形势比人强。
2023年12月19日,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程夸娥(KUAE)智算中心正式在北京揭幕,宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。 2024年12月30日,国产GPU厂商摩尔线程在官网正式上线了基于第二代 MUSA 架构的高性能专业显卡MTT X300。 2023年11月6日,摩尔线程CEO张建中发布内部信回应称:“整个国产GPU/AI芯片行业都受到了重创。在这个挑战与机遇并存的时间点,我想说的是,中国GPU不存在‘至暗时刻”,只有星辰大海。 对于国产芯片厂商来说,想要持续提升AI/GPU芯片的性能就需要依托于先进制程的加持,现在无法利用海外的先进制程代工服务,那么只能依托于国内的先进制程。 而目前国内仅有相当于7nm制程的制造能力,且良率和产能都有限,这也意味着国产AI/GPU后续的发展也将会受到一定的影响。 编辑:芯智讯-浪客剑
国产GPU双雄的科创板上市进程又进一步! 11月13日,国产GPU厂商摩尔线程正式发布科创板上市招股意向书,其网下申购代码688795、网上申购代码 787795,拟发行7000万股,占发行后总股本 14.89%,初步询价日为11月19日,网下 11月13日,另一家国产GPU厂商沐曦股份的科创板IPO申请在通过上市委的审批之后,正式获得了证监会同意沐曦股份首次公开发行股票的注册申请。 其中,24.59亿元用于“新型高性能通用GPU研发及产业化项目”、4.53亿元用于“新一代人工智能推理GPU研发及产业化项目”和9.91亿元用于“面向前沿领域及新兴应用场景的高性能GPU技术研发项目”。 从目前进度来看,摩尔线程将成为科创板的国产GPU“第一股”。 编辑:芯智讯-浪客剑
2025年9月22日,珠海香山会议中心热闹非凡,国产GPU标志性产品,芯动科技“风华3号”全功能GPU新品发布会在此举行。 珠海市相关领导、人工智能领域的科技领军人物,以及数据中心、互联网、医疗、教育、石油、电力、运营商、整机OEM/ODM等行业客户和生态伙伴济济一堂,近距离见证这款国产全功能GPU的精彩表现。 “风华3号”的推出,大幅提升了国产全功能GPU的性能水平,在大模型、大计算和大渲染领域,取得多个从0到1的突破,展现了芯动科技的卓越架构创新能力与深厚的技术底蕴。 多场景突破:筑牢大模型、大计算、大渲染算力底座 发布会上,风华3号通过现场一系列实测演示,展现了国产GPU的里程碑式的进步,在大模型、大计算、大渲染等多种核心场景下,实现了性能与应用的双重突破。 针对存力和运力瓶颈,“风华3号”是国内首款单卡配备112GB+大容量高带宽显存和自研IP的全功能GPU,较国内外竞品,数倍提升了存力,有效地容纳AI大参数模型,突破目前国产GPU显存和多卡搬运的上限,单卡即能支持多用户
马年农历春节前夕,国产智算卡再度迎来好消息!单卡FP8算力终于冲上1000TFLOPS了。 虽然国产GPU厂商摩尔线程在两年前就推出了专门面向大模型训练、推理及高性能计算设计的全功能GPU智算卡MTT S5000,但是具体的架构、参数和性能一直并未对外公布。 这不仅是国产GPU首次在单卡吞吐量上摸到国际顶尖门槛,更是为万亿参数大模型提供了真正可用的自主算力底座。 这一数据标志着国产GPU在单卡吞吐量上已可与国际主流一较高下。 ●计算精度: 该卡实现了从 FP8、BF16、FP16到FP32、FP64 的全精度计算支持。 实测S5000单卡Prefill吞吐超过4000 tokens/s,Decode吞吐超过1000 tokens/s,刷新了国产GPU的推理纪录。
这场风暴的导火索,竟是一颗被用于国内某大厂AI处理器的12nm芯片——这颗由大陆某公司设计、台积电代工的芯片,与国内某大厂的GPU算力卡的核心组件高度相似。 该工艺在性能、功耗与成本间取得平衡,广泛应用于边缘计算设备——这正是国内某厂商GPU算力卡发力的主战场。 国产替代突围倒逼:国内某大厂2023年搭载中芯国际7nm的国产芯片横空出世,证明大陆已突破部分先进制程。美方此次行动或是针对国内某大厂AI芯片供应链的“精准打击”,试图延缓其AI算力崛起速度。 但历史经验表明,市场规律终将冲破束缚的藩篱——国内某大厂自研GPU芯片采用自研芯片架构,中芯N+2工艺良率持续爬升,都印证着龙哥半导体“极限生存”能力的进化。
这场芯片风云之变中,“国产GPU”也被推到了聚光灯下。最近一段时间,看到很多有关的“国产GPU曝光”的新闻,随之而来的便是各种争议。 而就刚刚站上产业起跑线的国产GPU而言,其目标用户大多都是前两类。并且,相对于外国的同类产品,国产GPU还要在与其他国产平台、国产操作系统适配方面下更多功夫。 而对于第三层需求而言,坦率地讲,目前的国产GPU还无法满足,这也正是国内GPU企业始终在努力的目标。 “国产”二字成色几何? 另一方面,国产GPU还有一项无法回避的任务,那就是对数量众多的国产处理器平台和OS平台的支持,这些软硬件平台不仅数量众多且相互之间的底层差异极大,国产GPU团队要花费大量精力在对这些平台的支持上。 国产GPU 要走的路还很长 回到文章最初的问题,我们应该如何看待国产GPU?
这个成绩不仅刷新了国产 GPU 的推理性能记录,更以稳定的低延迟,验证了其 AI 算力的高效与可用性,成为了国产算力的一个里程碑。 上周六,国产 GPU 第一股摩尔线程,首次完整揭幕了其新一代统一计算架构 MUSA 的路线图。 在硬件层,本次发布的全功能 GPU 架构「花港」,标志着国产 GPU 在核心技术上的突破。 据介绍,「花港」在处理器架构、指令集层面进行了重新设计,旨在实现算力密度与能效比的飞跃。 MUSA 支持国际主流 GPU 生态,同时还支持国际通用的 CPU 系统,也支持所有国产主流 CPU、操作系统和国内开发环境。 图形处理方面,新架构集成了 AI 生成式渲染架构(AGR),增强的硬件光线追踪加速引擎(光线追踪性能比上一代提升 50 倍),并完整支持了 DirectX 12 Ultimate,这是国产 GPU 首次实现对行业顶级图形标准的完整支持
同时,这也意味着摩尔线程将成A股市场的国产GPU第一股! 作为国内知名的GPU新创企业,摩尔线程目前已有四代GPU,分别为“苏堤”、“春晓”、“曲院”和“平湖”。 其中,第四代GPU“平湖”于2024年推出,最大频率2GHz,拥有8192个着色核心、512个张量核心、光栅操作单元数量为512个、纹理映射单元数量也为512个,片间互联速率提高到了800GB/s,显存容量也提高到了 80GB,该GPU还增加了对FP8精度的支持。 此外,摩尔线程还推出了第一代SoC“长江”,集成了“全功能 GPU + CPU + NPU +VPU”等异构算力单元的片上系统芯片,拥有8核CPU,主频2.65GHz,GPU是MUSA架构,INT8算力达
第三章 浅谈GPU虚拟化技术(三)GPU SRIOV及vGPU调度 GPU SRIOV原理 谈起GPU SRIOV那么这个世界上就只有两款产品:S7150和MI25。 VF调度 AMD GPU SRIOV从硬件的角度看就是一个对GPU资源的分时复用的过程。因此其运行方式也是与GPU分片虚拟化类似。SRIOV的调度信息后续重点介绍。 GPU SRIOV的调度系统 分时复用 VF的调度是GPU虚拟化中的重点,涉及到如何服务VM,和如何确保GPU资源的公平分片。 GPU SRIOV也是一个分时复用的策略。 GPU分时复用与CPU在进程间的分时复用是一样的概念。一个简单的调度就是把一个GPU的时间按照特定时间段分片,每个VM拿到特定的时间片。在这些时间片段中,这个VM享用GPU的硬件的全部资源。 而有些方案则会严格要求在特定时间片结束的时候切换,强行打断当前GPU的执行,并交予下一个时间片的所有者。这种方式确保GPU资源被平均分摊到不同VM。AMD的GPU SRIOV采用的后一种方式。
近两三年GPU国产替代热度高涨,各家GPU硬件有各自的优势,某些数据精度也能跟英伟达PK,但唯独软件生态是短板。 目前,国产GPU尚未达到完全市场化的程度,处于市场开拓的早期,软硬件的原因都有。” 国产通用GPU从0到1,实现商业化可用 但值得肯定的是,国产通用GPU已打开局面。 如今,全球GPU市场已经形成垄断局面,相比于图形渲染GPU,通用GPU似乎发展前景更为广阔。 杨小东在谈及国产通用型GPU比渲染型GPU发展更为迅速的现象时表示。“AI市场潜力足够大,英伟达不可能全部吃下。随着英伟达从国内市场退出,国产厂商可以尝试吃掉英伟达的一部分蛋糕。 谈及国产GPU未来,邹翾认为,随着时间的推移,国产GPU性能不断攀升、应用将全面开花,有望在5~10年实现追赶。应用落地是提升国产GPU实力的最佳“试验田”。
作为一家成立仅六年国产GPU厂商,瀚博半导体已连续三年登上胡润全球独角兽榜单,2024年估值超过100亿元。 而在此之前,另外两家国产GPU厂商摩尔线程、沐曦股份均已向上交所科创板递交了IPO招股书,拟分别募资80亿元和39.04亿元。 资料显示,瀚博半导体于2018年12月成立于上海,是一家国产高端GPU芯片提供商,为智能核心算力和图形渲染提供全栈式芯片解决方案。 目前,瀚博半导体拥有自主研发的核心IP以及两代GPU芯片,提供适用于通用计算和图形渲染的GPU产品。 芯片系列产品的量产;2023年7月,瀚博半导体在2023世界人工智能大会上正式发布第二代全功能GPU SG 100,并推出南禺系列GPU加速卡 VG1600、VG1800、VG14以及LLM大模型AI加速卡