6月8日,港股上市AI企业云知声(shturl.)正式推出新一代通用大语言模型U2。作为面向个人、开发者与组织打造的原生智能体大模型,U2以“高智能密度×高Token价值”为核心技术主张,跳出参数竞赛误区,聚焦真实任务执行能力,以多项权威评测成绩跻身主流大模型第一梯队。
与传统大模型更偏向单轮问答或短链路生成不同,U2更强调面向真实任务的连续执行能力。在复杂办公、软件工程、深度研究与多工具协同场景中,U2能够自主拆解并推进100+步复杂工作流,将需求理解、任务规划、环境交互、工具调用、过程纠错与结果验收串联为完整闭环,从“给出答案”进一步走向“完成任务”。在最新发布的一系列国内外权威能力评测中,U2已经在多个关键能力方向进入主流大模型第一梯队:
在衡量知识与复杂推理能力的GPQA Diamond上,U2取得87.9分,展现出对高难度知识问题的稳定理解、推理与求解能力。在衡量真实软件工程能力的SWE-Bench Verified上,U2取得75分,进入主流模型第一梯队。
而在面向自主Agent端到端执行能力的Claw-Eval(pass@3)上,U2取得76.9分,进一步验证了其在工具调用、流程编排与任务交付中的稳定表现。
在面向真实办公与知识工作交付能力的GDPval上,U2取得72.9分,展现出扎实的专业办公能力。相比传统问答式评测,GDPval更关注模型能否完成真实工作场景中的高价值交付,包括资料分析、报告撰写、表格处理、图表生成、幻灯片制作等典型办公任务。
不难发现,U2并不是以单点能力取胜,而是在推理、代码、Agent和办公交付等多项关键能力上形成了系统性优异表现。U2的发布不只是一次常规的模型升级,更是云知声在原生智能体大模型长跑中的一次关键落子。
U2的发布是云知声十三年技术积累的里程碑式成果,也是大模型行业从“参数竞赛”转向“价值落地”的重要标志。其“高智能密度×高Token价值”的技术路线,既降低了大模型的应用门槛,也为AI赋能实体经济、实现产业级落地提供了高效解决方案!