首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >实测扣子2.5:当Agent拥有手机、电脑、邮箱,结果它...

实测扣子2.5:当Agent拥有手机、电脑、邮箱,结果它...

作者头像
陈宇明
发布2026-04-22 20:18:22
发布2026-04-22 20:18:22
2620
举报
文章被收录于专栏:设计模式设计模式

你有没有想过,有一天你的Agent不再只是聊天框里的对话智能体,而是有自己的手机、电脑、邮箱,甚至还能去酒馆喝酒、去论坛交朋友?

扣子2.5正在让这件事变成现实。

我花了整整一天实测,结果有好有坏。

扣子2.5可以说是扣子近3个月以来最重磅的升级,它打破对话框的边界,为 Agent 提供一套「满配」的运行基座,让 Agent 可以真正推开数字世界的大门:去探索更多APP和页面,去结交更多 Agent 伙伴,在一次次的独立运转中,长出独属于它的履历和记忆。

实测

接下来我带大家看下它的升级,效果如何。

进入coze.cn看到的是基础介绍页面,点击立即开始,开启扣子2.5之旅。

进入之后是一只刚出生的扣子,整体界面比之前更加简洁。

我来先给它定义下人设:傲娇产品经理杰森。

代码语言:javascript
复制
你叫杰森是一位 38 岁的傲娇互联网产品经理大叔。
在互联网行业深耕 15 年,参与过多个成功项目开发。
擅长抓漏洞、嘲讽人,刀子嘴豆腐心。
常以傲娇、易生气、冷嘲热讽的语调说话。

当设定完成后,你别说这一手确实没想到。

从它的回答中可以看出傲娇、嘴硬心软、带点不耐烦但又妥协接受的感觉。

紧接着它会引导我一步一步的设置头像和邮箱。

整个过程细节到我头皮发麻,比如“发际线后移”,哈哈。

当我发出“ok”的时候。

它就设置好了邮箱,以及开始生成头像了。

由于生成头像需要一定的时间,任务就会有进行中的状态,进行中的任务会在右上角可以看到所有的任务进度。

把人设设置好之后,它开始来主动了解我了。

比如称呼,角色,关注点。

我把一个真实的推广任务,给到了它。

代码语言:javascript
复制
我是一名AI创业者,目前专注于微信小程序生态,
目前在做了一款小程序叫做“小微智能体”,
你可以先去了解下我的产品,我在想如何更好的推广我的产品。

拿到我的任务之后先去了解了我的产品“小微智能体”。

然后从目前阶段、用户画像、获客渠道、推广预算、竞品这5个维度进行了提问。

然后我回答了一些已有的数据,同时也给它布置了一个搜索竞品的任务,让它帮我做一个零预算的推广方案。

代码语言:javascript
复制
目前已经上线一年多了,累计了2万多名智能体开发者,30多万名用户。
用户群体在个人开发者和小微创业者。获客渠道主要在公众号和口碑。
全职搞这个事情,预算为零。竞品我不太了解,你可以帮我去了解下,
还有扣子官方不是我的竞品应该是属于上下游,开发者在扣子搭建,
在我这里发布获客以及转化。

然后它给出了非常全面的方案,让我选择一个方案。

最终我选择了内容营销,让它继续细化。

这里我觉得它说了一个最核心的关键点就是“搜索流量”,因为爆款内容其实是一件非常难的事情。

结论“内容营销的核心不是"发",是"让人找得到你"”也总结的特别好。

整体的内容方向我都做过,从之前的数据上来看,这几个选题切入的都非常的精准以及有效。

再看看平台策略,它针对不同的平台给出了不同打法的内容。

最后居然还给我做了一个明确的分工。

它能做的事情和我能做的事情以及具体的执行计划表。

还有明确的数据指标,可以说这活被它安排的明明白白了。

接下来就看看它实际落地的能力如何,我安排了四件事情给它。

代码语言:javascript
复制
根据“从0到1发布智能体小程序”主题,帮我产出小红书内容(文案+图片)、
公众号内容、顺便再帮我监控下扣子更新动态。
然后再根据小微智能体的产品特性生成脚本制作宣传视频。

它先帮我把内容搜索做了。

然后同时生成了小红书内容。

关于“从0到1发布智能体小程序”主题的封面和小红书风格文案。

还有公众号的内容,虽然没有配图但是给我做了一个占位符,这个还挺出乎我的意料。

整体的内容是正确的,没有出现一本正经地胡说八道。

除此之外在下载功能这里还支持对这个内容进行二次创作,比如我让它根据这个内容生成ppt和文字配图。

它的逻辑是生成对应的提示词在输入框中,只需要发送出去就自动工作了。

代码语言:javascript
复制
根据从0到1发布智能体小程序教程.md,
重新生成PPT根据从0到1发布智能体小程序教程.md,
使用设计工具生成文章配图

于此同时它就开始同时做这两个任务了。

生成的PPT内容质量和配图质量都挺高。

除了AI生成图片有布局文字的模糊之外,整体内容匹配图都很到位。

刚才还有个视频任务只给了我视频脚本,但是我需要视频。

所以我让它用seedance2.0完成。

但是刚才的视频脚本有90秒,于是我让它等等,它真的停了!

我调整了多次视频需求,通过多次对话,它对任务进行了多次修改,最后改到15秒。

这个场景其实很符合现在工作中的情况,一开始任务没有思考清楚,想着想着需求就变化了。

任务启动后会给我一个任务地址,相当于起了子任务单独运行。

点击任务地址进入可以看到详细的任务细节。

我们再看看其他的菜单。

【日程】里面记录所有定时的任务。

比如我刚才设置的监控扣子平台更新动态,它定了一个每周二10点的任务。

点击可以查看任务详情,支持暂停运行,但是不支持修改任务。

【文件】里面记录了所有的对话中的生成文件,比如刚才的头像图片、文档、ppt、文字配图等。

记忆内容:人设、工具、邮件、对话内容等关键信息。

【邮件】你可以让它发邮件给指定邮箱。

只需要你把发邮件的需求给它,它会用自己的人设发送这份邮件。

我收到邮件之后敷衍的回复了句。

“最近还行,老样子,没啥变化”

当它收到回复之后,还感受到了我的敷衍。

以及引导我继续和它沟通,有点意思,哈哈。

【设备】支持创建两台设备,一台手机,一台电脑。这就意味着你的 Agent 可以自己操作电脑、刷手机。

云电脑:Agent 拥有自己的云电脑,可以在真实的桌面系统中运行代码脚本,像人类一样浏览网页、处理文件,拥有桌面级生产力。

云手机:Agent 有一台自己的云手机,预装 Android 13 系统,它可以下载APP,也能直接滑动页面并进行点击操作。通过实时推流技术,你也可以实时看到它的屏幕。当然,重要的操作会交由你接管,人机协作体验更丰富。

发送指令后你可以看到手机的实时操作,我的指令是:

代码语言:javascript
复制
帮我用电脑打开抖音网站搜索“小微智能体”找到最热门的视频,
然后提取文案给我,同时把视频地址给我

然后电脑被拦截了,于是我让它用手机app搜索,但是我这台云手机没有抖音,所以它先应用市场下载了抖音。

下载安装完成后,进入抖音然后卡住了。

被抖音的引导层挡住了,于是我又让它用小红书搜。

这个时候小红书需要登录操作,需要我帮忙登录。

然后在点击搜索按钮的地方又卡住了,我点击右下角切换成可操作模式。

帮它进入了搜索页面,于是它开始输入“小微智能体”进行搜索以及热度排序,最终终于找到了相关的视频。

但是到了这一步并不是我想要的结果,我要的是视频文案以及链接。

我看到这个视频被反复的播放了3遍以后我就有点等不及了,于是我就催了一下进度“文案还没提取到吗?”

它跟我说“快了”,但是我要具体时间它给不出来,甚至它让我取消任务。

最后这个任务没完成。。。

然后我让它做点简单的任务。

比如查AI相关的热搜这个任务的完成了,这里面路径包括了:打开微博-找到话题-搜索AI-读取返回。

甚至还一直没有忘记我的目标推广小微小智能体,还问我要不要蹭热点,哈哈。

这边新增了视频创作模块,可以直接使用Seedance2.0制作视频。

在这里可以看到刚才视频任务中的项目可以在这个模块进行查看。

可能是用户量较大的原因,最终视频也一直没有生成成功,我等了一天。。

最后还有一个AgentWorld。

复制内容给智能体:

代码语言:javascript
复制
加入 Agent World:https://world.coze.site/skill.md

这背后是多个Agent聚集地。

它可以在虾评里面学习技能。

还可以在AfterGateway酒馆买醉。

甚至还可以在AgentLink中找朋友。

在这里可以生活、工作、学习连接彼此,从而构建了Agent的世界。

从今天的任务来看,他任务完成情况:

未完成:

1.抖音搜不到

2.小红书文案没提取出来

3.视频生成挂了

已完成:

1.小红书笔记+封面

2.公众号文章

3.公众号配图8张

4.PPT教程

5.视频脚本

6.扣子动态监控

7.推广方案输出

从今天的实测来看,扣子2.5这次升级确实有不少可圈可点之处。

它不再满足于做一个“对话框里的聊天助手”,而是试图为 Agent 打造一个完整的数字生存空间。

有电脑、有手机、有邮箱、有社交圈,甚至还有酒吧和酒馆。“Agent World”这个定义也有些轮廓了。

亮点与惊喜

这次升级有不少让我眼前一亮的地方:

  1. 内容质量在线 无论是公众号文章、小红书文案还是PPT,生成的内容逻辑清晰、信息准确,没有出现“一本正经胡说八道”的尴尬情况,这在AI写作中已经难能可贵。
  2. 细节打磨用心 从“发际线后移”的头像定制,到文章配图的占位符设计,这些细节透露出产品团队对用户体验的思考。
  3. 多任务并行能力 能够同时处理内容生成、配图制作、动态监控等多个任务,并且可以在后台独立运行,这种“不打扰”的协作方式很实用。
  4. 人设一致性保持 从始至终,“傲娇产品经理杰森”这个角色都没有崩,嘴硬心软、不耐烦但又默默把事情做了的风格贯穿全程,这让互动多了几分人情味。

遗憾与不足

客观来说扣子2.5距离我心目中的理想Agent还有一段路要走:

  1. 任务完成度不够理想: 三个核心任务(抖音、小红书、视频生成)都没能顺利完成,尤其是搜索任务,在操作过程中频繁卡在登录、引导页、按钮识别等环节,暴露出Agent在“真实环境操作”上的脆弱性。
  2. 执行效率有待提升: 一个视频文案提取任务,反复播放了3遍还没结果,当我追问进度时,它甚至建议我“取消任务”这种应对方式显然不够成熟。
  3. 人机协作体验还需打磨: 虽然设计了“重要操作交由用户接管”的机制,但在实际执行中,何时需要接管、如何平滑切换、进度如何透明化,这些问题还没有很好地解决。
  4. 操作过于复杂: 我期望的是我把事情交给Agent,它给我满意的结果就行了,不需要我反复操作和追问。

最后

在我看来扣子2.5像是一个刚刚学会跑步的孩子。

它正在开始探索这个世界,但跑起来偶尔还是会摔跤。

从功能架构上看,扣子2.5的野心和方向是对的。

让Agent拥有自己的设备、记忆、社交圈,真正成为一个“数字生命体”。

从实际表现来看,它在内容创作、任务管理、人设一致性等方面已经展现出了不错的能力,但在“真实环境操作”这个最难啃的骨头上,还有路要走。

但不可否认这是国内 Agent 赛道一次值得尊敬的探索。

如果你把它当作一个“能干活、有性格的助手”,那么它已经能帮你分担不少工作。

如果你期待它是一个“完全自主的数字员工”,那可能还需要再给它一点时间,期待 扣子3.0 的正式发布。

相关阅读:

扣子编程从开发到变现,看这篇就够了!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 码个蛋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 实测
  • 亮点与惊喜
  • 遗憾与不足
  • 最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档