谷歌正式发布了Gemini 3.1 Pro模型,这款升级版模型在问题解决能力上实现了重大飞跃。目前该模型已作为预览版向开发者、企业及普通用户开放,旨在将原本属于Deep Think领域的复杂任务处理能力普及到日常应用中。与前代相比,Gemini 3.1 Pro在核心智能表现上显著增强,特别是在处理科学研究、工程设计与复杂逻辑推理方面展现卓越实力。
推理性能提升超过两倍
在针对抽象逻辑任务的ARC-AGI-2基准测试中,Gemini 3.1 Pro取得了77.1%的优异成绩,较Gemini 3 Pro的31.1%提升超过两倍。这一数据不仅超越了Anthropic的Opus 4.6(68.8%)与OpenAI的GPT-5.2(52.9%),更巩固了Google在AI领域的技术领先地位。除逻辑推理外,该模型在科学知识测试GPQA Diamond及多项代理任务基准测试中也表现卓越,展现出强大的代码编写与自主作业能力。
加速自动化工作流应用
Google展示了Gemini 3.1 Pro在实际应用中的潜力,例如模型能独立配置公共遥测数据串流,以可视化方式呈现国际空间站的轨道,或是直接根据文字指令生成动画SVG与构建完整网站。虽然在多模态测试MMMU Pro中,前代型号仍略微领先,且Anthropic的模型在某些工具使用效率上仍具优势,但Gemini 3.1 Pro透过更强大的推理能力,有效缩短了复杂API与用户友好设计之间的差距,为自动化工作流提供了更稳定、更智能的支持。
采分层定价策略降低企业成本
目前Google已在多个平台同步推出Gemini 3.1 Pro,开发者可透过Gemini API、Google AI Studio及Android Studio存取,而企业用户则可经由Vertex AI使用。在定价策略上,API费用根据提示长度缩放,整体成本显著低于Anthropic的Opus模型,具有极高的竞争力。Google表示将持续根据用户回馈调整模型,特别是针对具有野心的代理工作流进行优化,以确保未来正式版本能更精准地满足市场需求。