首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯混元 Hy3 Preview 开源发布:295B 混合专家模型,全面重构大模型“真实战斗力”

腾讯混元 Hy3 Preview 开源发布:295B 混合专家模型,全面重构大模型“真实战斗力”

原创
作者头像
干饭第一名
发布2026-04-24 16:35:45
发布2026-04-24 16:35:45
4950
举报

导语: 2026年4月23日,腾讯混元大模型迎来了一次里程碑式的更新——Hy3 preview 语言模型正式发布并宣布同步开源。

作为混元团队在今年2月全面重建预训练和强化学习基础设施后的首个模型,Hy3 preview 并没有盲目堆砌参数,而是走了一条极其务实的路线:总参数 295B,激活参数 21B,最大支持 256K 上下文长度。 这款主打“快慢思考融合”的 MoE(混合专家)模型,在代码、智能体(Agent)和复杂推理能力上实现了史诗级跃升,被腾讯称为“迄今为止最智能、最具性价比的混元模型”。


🏗️ 架构与理念重构:告别“偏科”与“无脑刷榜”

当前大模型圈陷入了严重的“刷榜内卷”,而 Hy3 preview 的发布,标志着腾讯混元在追求实用性上确立了三大核心原则:

  1. 能力体系化(拒绝偏科): 纯粹的代码能力并不足以支撑复杂的智能体。Hy3 强调推理、长文、指令、对话、工具调用的深度协同。
  2. 评测真实性: 主动跳出容易被“特化训练”的公开榜单,转而采用自建题目、最新真实考试(如期中/期末试卷)、人工评测和产品众测来检验模型的“真实战斗力”。
  3. 极致性价比: 没有商业合理性的强模型是空中楼阁。Hy3 深度协同了模型架构与推理框架,大幅压降了任务成本。

🧠 核心能力硬核解析:Agent 与代码的全面爆发

从多项实测结果来看,Hy3 preview 在以下三个维度的表现尤为抢眼:

1. 复杂推理:清华数学博资考登顶

复杂推理是 AI 解决真实世界难题的基石。在最新的 清华大学求真书院数学博士资格考(26春) 以及 全国中学生生物学联赛(CHSBO 2025) 等硬核理工科测试中,Hy3 preview 均取得了国内模型的最高分,展现了极其强悍的泛化推理能力。

2. Agent 与代码引擎:生产力工具的质变

这是 Hy3 提升最猛烈的领域。得益于强化学习任务规模的扩大,模型在数字世界的执行与检索能力大幅跃升:

  • SWE-Bench Verified(软件工程基准)、Terminal-Bench 2.0(终端操作基准)中表现出极强的竞争力。
  • BrowseCompWideSearch 等主流搜索智能体基准中,展现了对开放信息的精准提取。
  • 完美支持接入 OpenClaw、OpenCode、KiloCode 等开源智能体产品。

3. 超长上下文与指令遵循

为了解决冗杂上下文中的“大海捞针”和复杂规则遵循问题,混元自建了 CL-benchCL-bench-Life 评测集。实测表明,在 256K 的超长上下文中,Hy3 依然能保持极高的指令服从度。


🚀 腾讯“全家桶”实战:真实业务场景的终极检验

不看广告看疗效。在正式开源前,Hy3 preview 已经在腾讯内部的多条主线 AI 产品中完成了灰度验证,并取得了惊人的正向收益:

  • 开发者工具 (CodeBuddy & WorkBuddy): 首 Token 延迟暴降 54%,端到端耗时降低 47%,成功率飙升至 99.99%+。目前已稳定驱动最长 495 步 的复杂 Agent 工作流(涵盖文档处理、代码编写、数据分析与 MCP 工具链编排)。
  • 腾讯元宝 & ima: 深度 Co-Design 调优。大幅优化了长文检索的准确率,同时在文风、情商和内容组织上进行了精细微调,交互体验更具“活人感”。
  • 游戏 AI (和平精英 NPC): 在局内高压对战场景下,回复节奏完美贴近真实玩家,角色扮演的稳定性与拟人度极高。
  • 腾讯文档 AI PPT: 生成成功率提升 20%,耗时缩短 20%,无幻觉且视觉排版大幅优化。

💰 算账时间:同等算力下的“智能密度”之王

对于广大开发者而言,好用且用得起才是王道。通过算子性能和量化算法的全面重构,Hy3 preview 的整体推理效率提升了 40%

目前,Hy3 preview 已正式上架腾讯云大模型服务平台 TokenHub,API 定价堪称“击穿底线”:

  • 输入价格: 1.2 元 / 百万 Tokens
  • 命中缓存输入: 低至 0.4 元 / 百万 Tokens
  • 输出价格: 4.0 元 / 百万 Tokens

此外,腾讯云还联合混元推出了专为 Agent 开发者量身定制的 Hy3 preview Token Plan 套餐,个人版定价仅 28 元/月,为构建高频调用的“龙虾”应用提供了极具吸引力的选择。

结语

作为混元重建后的首秀,Hy3 preview 不仅交出了一份惊艳的答卷,更向整个行业传递了一个明确的信号:大模型正在从“拼参数”的炫技时代,全面步入“拼落地、拼成本、拼 Agent 稳定性”的实用主义纪元。

目前,开源社区的开发者们已经开始用各种极限 Case 对它进行“拷问”。你的业务工作流,准备好迎接 Hy3 的算力加持了吗?


标签: #腾讯混元 #Hy3 #大模型开源 #Agent #AI开发者 #人工智能

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 🏗️ 架构与理念重构:告别“偏科”与“无脑刷榜”
  • 🧠 核心能力硬核解析:Agent 与代码的全面爆发
    • 1. 复杂推理:清华数学博资考登顶
    • 2. Agent 与代码引擎:生产力工具的质变
    • 3. 超长上下文与指令遵循
  • 🚀 腾讯“全家桶”实战:真实业务场景的终极检验
  • 💰 算账时间:同等算力下的“智能密度”之王
  • 结语
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档