首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Gemini 3 发布:全新推理与智能体能力

Gemini 3 发布:全新推理与智能体能力

原创
作者头像
用户11764306
发布2026-01-28 23:17:35
发布2026-01-28 23:17:35
4780
举报

如今,我们正式推出 Gemini 3,这是我们最具智慧的模型,能够帮助将任何想法变为现实。Gemini 3 Pro 基于最先进的推理能力构建,与先前版本相比,在每一项主要 AI 基准测试中都提供了无与伦比的结果。它在编码方面也超越了 2.5 Pro,精通智能体工作流和复杂的零样本任务。

Gemini 3 Pro 可以无缝融入现有的生产级智能体和编码工作流,同时也能实现以往不可能的新用例。通过某中心的 AI Studio 和面向企业的 Vertex AI 中的 Gemini API,可以预览使用,对于不超过 20 万 Token 的提示,定价为输入每百万 Token 2 美元,输出每百万 Token 12 美元(关于速率限制和完整定价细节,请参阅定价信息)。此外,您也可以在更广泛的生态系统内通过您喜爱的开发工具使用它,并且在某中心的 AI Studio 中可以免费使用(有速率限制)。

智能体编码

开发者越来越多地借助 AI 来创建软件。基于 Gemini 2.5 Pro 的势头和所有反馈,Gemini 3 Pro 作为智能的新基础,为智能体编码模型的可能性奠定了基础。

  • Gemini 3 Pro 在 Terminal-Bench 2.0 上获得了 54.2% 的分数,该基准测试评估模型通过终端操作计算机的工具使用能力。

除了 Gemini CLI、Android Studio 以及其他编码产品外,您还可以在某中心新的智能体开发平台 Antigravity 中感受到这个模型的强大力量。

某中心 Antigravity

为了推进模型与 IDE 的协同工作,现推出某中心 Antigravity,以展示 Gemini 3 的可能性。这是一个智能体开发平台,使开发者能够在更高、面向任务的级别上进行操作,同时跨工作空间管理多个智能体,而其核心仍保留了熟悉的 AI IDE 体验。

这是一种更快速的开发方式:您扮演架构师的角色,与在编辑器、终端和浏览器中自主运行的智能智能体进行协作。这些智能体规划并执行复杂的软件任务,并通过详细的工件与用户沟通其工作。这提升了开发的各个方面,从构建功能、UI 迭代、修复错误,到研究和生成报告。

Gemini API

随着 Gemini 3 的推出,现发布一个客户端 bash 工具,使模型能够提出 shell 命令,作为智能体工作流的一部分,用于诸如导航本地文件系统、驱动开发过程和自动化系统操作等任务。我们将其与一个托管在服务器端的 bash 工具配对,用于多语言代码生成和安全原型设计。该功能现已面向早期访问合作伙伴在 Gemini API 中提供,并将很快全面上市。

此外,Gemini 托管的工具(如某中心搜索和 URL 上下文)现在可以与结构化输出结合使用。这对于构建涉及获取、提取数据并以特定格式输出以供下游智能体任务处理的智能体用例尤其强大。

直觉式编码

Gemini 3 Pro 释放了“直觉式编码”的真正潜力,自然语言是您唯一需要的语法。通过显著改进复杂指令遵循和深度工具使用能力,模型可以通过单一提示将一个高层次想法转化为一个完全交互式的应用程序。它处理多步规划和编码细节的重任,提供更丰富的视觉效果和更深度的交互性,让您能够专注于创意构想。

  • Gemini 3 Pro 在 WebDev Arena 排行榜上名列前茅,获得了令人印象深刻的 1487 Elo 分。

某中心 AI Studio

无论是用一个提示构建一个游戏,从非结构化的语音笔记创建一个交互式登录页面,还是从一张草图构建一个完整的应用程序,开发者都可以用 Gemini 3 将他们的想法变为现实。利用这个模型,我们将单提示生成能力推向了前所未有的高度,意味着您可以仅用一个提示就从想法变成 AI 驱动的应用。

我们已经将某中心 AI Studio 构建为您从提示到 AI 原生应用的最快路径。构建模式让您比以往更快地添加 AI 功能,自动连接正确的模型和 API,而诸如注解等功能则支持快速直观的迭代。您今天就可以在某中心 AI Studio 中开始使用 Gemini 3 进行构建。

多模态理解

Gemini 3 是世界上处理复杂多模态理解的最佳模型,在 MMMU-Pro(复杂图像推理)和 Video MMMU(视频理解)上创下新高。结合其智能和 100 万 Token 的上下文窗口,开发者在构建关键的多模态用例时可以体验到显著改进。为了让您更好地控制延迟和成本,现在可以根据应用程序所需的视觉保真度,在 Gemini API 中更精细地配置多模态视觉处理。

视觉推理

Gemini 3 Pro 在文档理解方面是同类最佳,超越了简单的 OCR,能够智能地处理复杂的文档理解和推理。

空间推理

该模型改进的空间理解能力也使其在具身推理任务中表现强劲,例如指向、轨迹预测和任务进展,为自动驾驶汽车、XR 设备和机器人等领域解锁了新用例。

其空间推理能力还支持对桌面、移动设备和操作系统屏幕的智能理解,为计算机使用智能体带来了显著的性能提升。该模型还能根据鼠标移动和屏幕注释理解用户的意图,解锁了诸如 Visual Computer 演示应用中的新颖体验。

视频推理

Gemini 3 Pro 凭借高帧率理解能力捕捉快速动作,确保开发者不会错过快节奏场景中的关键时刻。除了速度,长上下文记忆能力允许在连续数小时的镜头中综合叙述并精确定位特定细节。

立即构建未来

Gemini 3 Pro 现已集成到许多开发者产品与工具中,以无缝融入您现有的工作流,并解锁全新的编码方式。

  • 使用 Gemini API 构建:您可以通过某中心 AI Studio 和面向企业的 Vertex AI,立即将 Gemini 3 Pro 集成到您的应用程序中。为了支持模型更深层的推理能力,我们在 API 中引入了新的思维级别和更精细的媒体分辨率参数,以及对思维签名的更严格验证。此更新对于在多轮对话中保留模型的思维至关重要。
  • 体验模型的智能体能力:无论是为 Android 应用添加 AI 原生功能,通过 Gemini CLI 自动化工作流,还是在某中心 Antigravity 中管理一组自主智能体,Gemini 3 Pro 都为复杂的智能体架构提供了所需的可靠性。
  • 使用 Gemini 3 Pro 进行直觉式编码:某中心 AI Studio 是您将任何想法变为现实的最快途径。从构建模式开始,通过单一提示生成一个功能齐全的应用程序。如果您需要一点灵感,请点击“试试手气”,让 Gemini 3 Pro 同时处理创意灵感和代码实现。

软件格局正在转变。随着 AI 改变构建者和构建方式,我们致力于在您所在的位置与您相遇——为您提供推动可能性边界的工具。

这只是 Gemini 3 时代的开始,但我们迫不及待想看到您用 Gemini 3 Pro 构建出什么!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档