首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Google把Gemini的自动化功能带到了Android上:AI Agent崛起,从工具到执行者的范式转移

Google把Gemini的自动化功能带到了Android上:AI Agent崛起,从工具到执行者的范式转移

作者头像
mixlab
发布2026-03-25 09:57:23
发布2026-03-25 09:57:23
560
举报

2月25日,Google发布了一项新功能:Gemini可以帮你叫Uber。从说"帮我叫一辆Uber去机场"到完成选车型、确认地址、支付下单——整个过程你只需要看着屏幕。这标志着AI从"回答问题的工具"正式进化为"替我办事的执行者"。

当AI不再是"答案引擎"

过去十年,我们习惯了这样的AI:问一个问题,它给出一个答案。Siri帮我查天气,ChatGPT帮我写文案,Midjourney帮我画图 —— 它们是出色的"协作者",但始终停留在"我指挥,它执行"的模式。

2025年下半年开始,行业风向变了。OpenAI在ChatGPT中推出Agent功能,用户可以创建能够"按计划或特定时间运行"的任务。Anthropic发布Cowork,让非开发者也能用Claude AI自动化日常文件管理。而OpenClaw更是在年初火遍全网——它能帮你发邮件、管理日历、办理登机手续。

这些事件的共同信号是:AI正在从工具变成"数字员工"。

Sam Altman曾说:"AI将改变人类与计算机交互的基本方式。"这句话的潜台词是:未来,你可能不再需要自己点击鼠标、填写表格,AI会帮你做完这些"苦差事"。

手机端:AI Agent的第一块试验田

Google这次把Gemini的自动化功能带到了Android上,意义深远。

首先,这是首次有主流手机操作系统原生支持AI自动化多步任务。以往你要实现"自动叫车",要么用自动化的第三方工具,要么自己写脚本。现在,Google直接在系统层面实现了——用户只需要对Gemini说一句"帮我叫Uber",AI就会在后台模拟人类操作:打开App、选择车型、确认地址、完成支付。

其次,这代表了入口的迁移。过去,我们通过App使用服务;现在,AI可能成为新的"中间层"。Google官方博客说:这是"将用户的待办事项交给Gemini"。想象一下,在未来你不再需要打开十几个App,AI帮你统筹一切。

当然,隐私和安全是绕不开的话题。Google在虚拟窗口中运行自动化,限制AI只能访问特定App的数据。这是负责任的做法,但随着AI权限越来越大,隐私边界需要重新定义。

为什么是2026?因为"执行"需要能力铺垫

AI Agent的爆发不是偶然,而是技术成熟度的必然。

大语言模型的多步推理能力已经足够强。2024年的GPT-4已经能处理复杂逻辑,2025-2026的模型更是具备了"规划-执行-验证"的思维链。这意味着AI不只是"想到",还能"做到"。

工具调用(Tool Use)生态的完善同样关键。Anthropic的Computer Use、OpenAI的Function Calling、各大厂商的MCP协议,这些让AI能够"动手"操作外部世界。一个能"思考"但不能"行动"的AI是脆弱的;可当AI学会使用工具,就开始爆发了。

我们受够了"信息过载"和"操作繁琐"。现代人的手机里有上百个App,每个App都有复杂的交互 —— 叫车要选车型、点外卖要选菜品、订酒店要比较价格。AI Agent的价值,就是把这些繁琐流程"一键外包"。

对创业者的启示:三个机会

第一,应用层的重新定义。 当AI能"替我办事",所有"中间页"、"聚合平台"、"流程工具"都可能面临重构。比如:现在的比价网站还有价值吗?AI直接帮你选最便宜的单子。AI帮你订票,你甚至不知道中间商是谁。

第二,垂直领域的Agent蓝海。 Google做的是通用场景,但每个行业都有独特的"自动化需求"。医疗预约、法律咨询、税务申报等,这些领域的复杂流程,是创业者建立壁垒的机会。我也一直思考:"AI Agent是未来的重要方向,创业者需要关注如何把AI能力落地到具体场景。"

第三,"AI硬件"的再次复兴。 当软件层面的Agent能力趋同,硬件就成为差异化的关键。Rabbit R1、Human AI Pin,这些设备可能失败,但"AI原生硬件"的探索不会停止。未来的设备,可能是"AI大管家",你说话,它操作一切。

你是"指挥家"还是?

凯文·凯利在《必然》中写道:"未来的人机关系,是人类做决策,机器做执行。"2026年的今天,这句话正在变成现实。

但有一个问题我们必须思考:当AI能替我们做事,我们还"会"做事吗?就像计算器让我们大部分人失去心算能力,AI Agent可能让我们失去"操作"的能力,而操作,本身也是一种思考。

或许,未来的"文盲"不是不识字的人,而是不会"指挥AI"的人。

致最先触达未来的那一小部分人: 如果你正在做AI Agent相关的创业,或对这个领域感兴趣,欢迎在评论区聊聊:你认为AI Agent最先颠覆的行业,会是哪个?


参考

[1] Gemini can now automate some multi-step tasks on Android. TechCrunch

[2] Google Android Product Updates. Google Blog.

[3] OpenAI launches a general-purpose agent in ChatGPT. TechCrunch.

[4] Anthropic's Cowork tool offers Claude without the code. TechCrunch.

[5] Everything you need to know about OpenClaw viral AI assistant. TechCrunch.

[6] shadow的笔记

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-02-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 无界社区mixlab 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 当AI不再是"答案引擎"
  • 手机端:AI Agent的第一块试验田
  • 为什么是2026?因为"执行"需要能力铺垫
  • 对创业者的启示:三个机会
  • 你是"指挥家"还是?
  • 参考
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档