首页
学习
活动
专区
圈层
工具
发布

沐曦股份联合上海人工智能实验室发布高性能GPU算子生成系统

观点网讯:近日,上海人工智能实验室和沐曦股份联合发布了高性能GPU算子生成系统—— Kernel-Smith。

据悉,Kernel-Smith创新性地将“稳定评估驱动的进化智能体”与“面向进化的后训练范式”深度融合,依托上海人工智能实验室书生大模型Intern-S1-Pro的基座能力进行深度定制化训练,让大模型真正化身为“算子优化大师”。

在双方的合作中,沐曦团队全程深度参与。联合创始人、CTO兼首席软件架构师杨建、研发副总裁黄向军、AI部门的武亚光、董华楠、谢佳形均参与了该项目并做出贡献。

沐曦自研软件栈MXMACA展现出了深度兼容能力。在MXMACA后端测试中,Kernel-Smith 表现出色。研究团队在四类常用算子上对比了不同模型生成高性能 MXMACA 算子的能力,结果显示,Kernel-Smith-MACA-30B 的平均加速比超过了 DeepSeek-v3.2 和 Qwen3-235B-2507 等大参数量的开源模型,而 Kernel-Smith-MACA-235B 取得了进一步性能提升,验证了 Kernel-Smith 框架支持异构平台的能力。

目前,Kernel-Smith 自动生成的高性能算子已在实际场景中得到应用:不仅加速了 DeepSeek 新架构 Engram,并合入 DLBlas;还落地主流生产级推理引擎 SGLang 和 LMDeploy,实现了大模型自动生成算子从实验室受控评估,到前沿模型研发与生产级部署的双重跨越。

免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O2bHNJFrie7OlO4RXdhmUCYw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券