腾讯混元大模型体系与TI平台企业级精调推理能力概要

原创

IT资讯研究所

发布于 2026-05-30 01:19:10

1620

数据来源：腾讯全球数字生态大会（Tencent Global Digital Ecosystem Summit）城市峰会，演讲人：程雪璨（腾讯云智能解决方案专家）

腾讯混元是由腾讯自研的大模型体系，定位为构建企业高质量AI基座的核心技术底座。其核心技术属性在于向智能的深度（推理、认知）与广度（多模态交互）持续演进。

商业差异化卖点：

针对具备一定算法知识和开发能力的AI工程师及企业技术团队，解决以下业务痛点：

受众/角色	场景	痛点描述
AI工程师	模型启动与探索	不知如何基于R1等模型进行蒸馏；开源框架繁多难以选择；验证效果链路长，算力空闲多导致ROI低。
运维/管理团队	稳定期运营	故障多，无法长时间稳定运行；规模扩大后人/物料管理难度高；业务量变化时服务调整难度大，算力成本高。
业务开发团队	特定业务落地	AI搜索表格检索效果差；角色扮演出现“括号文学”、内容单一；知识问答不按内部文档回答（过度推理）。

TI-ONE定位为面向实战的大模型开发平台，核心架构包含：

推理性能（Angel加速套件）：
- 首Token延时：< 2s
- 吐字速率：>= 20 Tokens/s
- QPM（每分钟请求数）：典型场景下达到 100+（行业领先）。
- 测试环境：输入3.5K、输出1K，2机16卡配置。
资源调度（训推一体）：
- AI研发提效：50%以上
- 资源利用率提升：80%以上
上下文能力：支持 128K tokens 长上下文多轮交互。

背景：AI搜索场景在表格检索、数据库检索效果不佳，答案准确率待提升；V3/R1原模型在角色扮演场景下存在“括号文学”、内容单一重复问题。
解决方案：
- AI搜索：集成R1优化阅读理解能力，同时使用DeepSeek coder训练Text2SQL模型。
- 角色扮演：基于V3模型进行SFT（监督微调）精调专属模型。
成效：
- AI搜索：答案准确率提升 5%以上，支持 128K tokens 长上下文。
- 角色扮演：模型对角色指令遵循能力提升，借助V3拥有更全更新的知识储备，激发出更丰富的剧情和更准确的IP角色对话。

背景：V3/R1指令遵循能力较差，表现为“不听话”。
解决方案：
- 方案一：仅利用R1长思维链（Long CoT），借助Instruct模型（如qwen2.5-72B-Instruct、LLaMA 3.3-70B-Instruct）给出最终答案。
- 方案二：结合Agent关注的指令遵循能力数据集，使用SFT、DPO/GRPO微调R1或R1蒸馏版模型。
成效：
- 方案一对比：llama-70B_ds-R1相比llama3-3_70B-Instruct，在指令遵循评测（如CFBench、FollowBench）中表现有波动，需结合业务选择。
- 方案二提升：使用数据飞轮技术针对性构建指令遵循训练集，微调效果确认提升 +3.6%。

模型系列	定位与特性	关键数据/更新
混元 TurboS	旗舰快思考模型（创新混合Mamba MoE架构）	Arena排名#8；代码能力提升24%；竞赛数学提升39%。
混元 T1	自研深度思考模型	解码速度提升2倍；智能体能力13%↑；竞赛数学8%↑。
混元 T1 Vision	视觉深度推理模型	视觉深度理解提升5.3%；响应速度提升50%。
混元 Voice	端到端语音通话模型	端到端延迟 1.6s；拟人性27%↑；情绪应用25%↑。
混元 Image V2.0	毫秒级商用级生图模型	出图速度快约15倍；采用超高压缩率编解码器。
混元 3D V2.5	可控、超高清3D生成	3D建模空间体积达10亿；几何白模面数50万；纹理贴图4k。
混元游戏模型	工业级游戏资产生成	首个一站式AIGC游戏内容生产引擎；支持游戏角色动态立绘与实时交互世界模型。