沐曦股份联合上海人工智能实验室发布高性能GPU算子生成系统

文章来源：企鹅号 - 观点新媒体

观点网讯：近日，上海人工智能实验室和沐曦股份联合发布了高性能GPU算子生成系统—— Kernel-Smith。

据悉，Kernel-Smith创新性地将“稳定评估驱动的进化智能体”与“面向进化的后训练范式”深度融合，依托上海人工智能实验室书生大模型Intern-S1-Pro的基座能力进行深度定制化训练，让大模型真正化身为“算子优化大师”。

在双方的合作中，沐曦团队全程深度参与。联合创始人、CTO兼首席软件架构师杨建、研发副总裁黄向军、AI部门的武亚光、董华楠、谢佳形均参与了该项目并做出贡献。

沐曦自研软件栈MXMACA展现出了深度兼容能力。在MXMACA后端测试中，Kernel-Smith 表现出色。研究团队在四类常用算子上对比了不同模型生成高性能 MXMACA 算子的能力，结果显示，Kernel-Smith-MACA-30B 的平均加速比超过了 DeepSeek-v3.2 和 Qwen3-235B-2507 等大参数量的开源模型，而 Kernel-Smith-MACA-235B 取得了进一步性能提升，验证了 Kernel-Smith 框架支持异构平台的能力。

目前，Kernel-Smith 自动生成的高性能算子已在实际场景中得到应用：不仅加速了 DeepSeek 新架构 Engram，并合入 DLBlas；还落地主流生产级推理引擎 SGLang 和 LMDeploy，实现了大模型自动生成算子从实验室受控评估，到前沿模型研发与生产级部署的双重跨越。

免责声明：本文内容与数据由观点根据公开信息整理，不构成投资建议，使用前请核实。

发表于: 2026-04-032026-04-03 19:04:17
原文链接：https://page.om.qq.com/page/O2bHNJFrie7OlO4RXdhmUCYw0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

沐曦股份联合上海人工智能实验室发布高性能GPU算子生成系统

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐