首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >让Siri沉默,让App恐慌:这台“听懂就干”的手机,凭什么被疯抢?

让Siri沉默,让App恐慌:这台“听懂就干”的手机,凭什么被疯抢?

作者头像
Henry Zhang
发布2026-01-07 18:11:06
发布2026-01-07 18:11:06
1870
举报
文章被收录于专栏:亨利笔记亨利笔记腾讯云TVP

不久前,一款“听懂就干”的手机诞生了。

字节跳动与努比亚推出的 Nubia M153 工程样机,搭载了一个名叫“豆包手机助手”的 AI。它不仅能听懂你的话,还能替你动手:点外卖、订票、修图、写请假条,甚至跨App比价、生成攻略。

手机,第一次真正有了“手”!

这台起售价3499元的手机迅速售罄,二手市场一度炒到近万元。这不是一场普通的抢购,而是一次数字世界的“觉醒仪式”——手机不再是被动响应的工具,而开始成为能主动为你办事的“智能代理人”。

它到底有多强?

你只要对它说一句:“帮我比价三杯蜜雪冰城并下单”,它就能自己打开外卖平台,选规格、比价、领券、填地址,最后停在支付页等你确认。想整理北京三日游攻略?它瞬间穿梭于携程、美团、地图App之间,抓机票酒店信息,生成攻略文档存入备忘录。

这不是语音助手,而是“数字替身”。一夜之间,手机从“人找App”进入了“AI替你做”的时代。

捅破那层“窗户纸”,AI第一次真正“动手”了

用 iPhone 的朋友常吐槽:“ Siri 已经十年没进步了。” 没错,过去的语音助手本质还是“问答机”:定闹钟、查天气、讲笑话,可以。但真要它动手干点正事?没门!

豆包助手不一样。它之所以能“动手”,是因为它拿到了系统级的通行证。

通过与手机厂商在操作系统层面深度合作,它获得了对屏幕界面元素的“视觉”和“触觉”。可以理解为:它不再是一个被关在App盒子里的工具,而是一个能看见屏幕、能模拟点击、能穿梭于不同应用之间的“数字人”。

虽然目前主流的AI助手已经具备使用计算机(Computer Use)的能力,即可模拟人的行为来操作计算机,但在手机端实现类似的功能(Mobile Use)还是先例,也难怪豆包助手能如此惊艳。

但话说回来,这种能力背后采用的是一种“笨办法”:它要把屏幕内容上传到云端,用视觉模型识别按钮、菜单,再模拟点击操作。效率低、耗流量、费算力。就像是你雇了个视力超群的秘书,但她每次操作前都要打电话问总部:“这个按钮在哪?我该点吗?”

笔者认为,更理想的架构,应是在手机操作系统中提供类似MCP的标准接口,让App把AI功能“挂载”上来,AI助手可直接调用App的功能,不用再“看图点屏”。但这需要App厂商、手机系统、AI公司三方开放协作——在如今的商业高墙林立的环境里,实则难如登天。

手机智能体架构

所以豆包无奈之下选择了这条“绕远路”的方法。虽看似繁琐,但这层“窗户纸”终究还是被捅破了。

能读你微信的AI,值得信任吗?

能力越强,责任越大。一个能读你短信、翻你相册、代你下单的AI,是不是也在监视你?

面对质疑,字节赶紧出来解释,主打两个关键词:本地记忆和显式授权。

  • 用户的习惯偏好(比如常坐的高铁座位、爱喝的奶茶口味)只存在手机本地,加密不上云;
  • 涉及支付、金融、敏感操作时,必须用户亲自点“同意”;
  • 12月初字节团队还主动设限:禁止刷分、禁止自动化交易——姿态放得很低,生怕用户害怕。

但问题依然存在:如果系统权限被黑客利用呢?如果AI“自作主张”呢?信任不是一次公告能建立的,它需要细到每个按钮的权限控制和可追溯的每步操作。

超级App的“围墙”正在崩塌?

这才是最让互联网大厂后背发凉的地方。

过去十数年,超级App们用尽心思把用户“留在”里面:签到领红包、看视频得优惠、分享再打折……所有设计都是为了延长你的停留时间,好卖广告、做交易、建闭环。

但现在,豆包让用户不用打开App就能完成服务。

想比价?它打开美团、京东,比完帮你选最便宜的。想订票?它直接爬取携程、飞猪、12306,整理好给你选。广告被跳过、流程被缩短、入口被架空:App退化成“后台服务商”,品牌和用户粘性一夜稀释。

难怪周鸿祎说:“美团淘宝的高管们可能要连夜开会了。”

可以预见,一场攻防战已经打响:

  • App们会筑起“数字围墙”:禁止截屏、动态验证、页面混淆……想用AI操控我?此路不通!;
  • 手机厂商也不会坐视:华为、小米很可能推出自己的AI助手,把豆包“挤出”系统层;
  • 监管或许也会入场:要求开放接口,防止生态割裂。

但用户对“方便”的追求是不可逆的。长远看,开发者或许得换种活法:从“争抢注意力”转向“竞争服务效率”,把核心功能打包成AI可快速调用的模块,迎接一个“AI服务直达”的新时代。

谁是下一个“操作系统”?

豆包没有自己造手机,而是选择与中兴等厂商合作。输出AI能力,让硬件厂落地,这是一种聪明的“软硬协同”。

有预测称,到2028年,全球超过一半的手机将是AI手机。未来的手机桌面,可能不再布满App图标,而是一个随时待命的AI。你开口,它办事。

这意味着,AI助手本身,可能成为下一代“操作系统”:它定义交互逻辑、调度服务、积累偏好,掌握着你数字生活的决策权。

字节跳动借此补上了硬件生态的短板。如果它能拉起一套跨厂商的AI助手标准,或许真能迎来AI时代的“安卓时刻”。

当然,现在的豆包还不完美:反应有时慢、指令会误解、游戏场景失灵……但它的出现,已经指明方向:AI正从“回答者”变成“执行者”,从应用层下沉到系统层,一场关于“手机灵魂”的权力转移,已经开始了。

结语:我们正在开启一个全新的智能时代

回顾智能手机历史,有几个关键转折点:从键盘到触屏(iPhone)、从工具到生态(微信)、从信息到服务(美团)。如今,豆包带来的可能是从“人操作App”到“AI代理一切”的范式革命。

它不只是一个新功能,而是一种新关系:人和机器的边界正在模糊。

你可以担忧隐私和质疑垄断;也可以期待更流畅的生活和更自由的数字体验。

但无论如何,一个更智能和更主动的时代已经拉开序幕。而你手中这台越来越“懂事”的手机,或许正站在那个门槛上。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-12-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 亨利笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 能读你微信的AI,值得信任吗?
  • 超级App的“围墙”正在崩塌?
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档