首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >云手机Claw一键部署OpenClaw.pdf

云手机Claw一键部署OpenClaw.pdf

原创
作者头像
gawain2048
发布2026-03-20 12:07:52
发布2026-03-20 12:07:52
3840
举报

腾讯云云手机AI实践概要:Mobile Use Agent与OpenClaw智能体架构与能力解析

一、 产品定位与核心亮点

技术定义

腾讯云云手机AI方案是一套基于“LLM 大模型 + GUI Agent + 云手机 PaaS”架构构建的智能体执行环境。该方案通过提供底层的 ARM 算力与应用层开发环境,支持部署移动端智能体(Mobile Use Agent)及个人 AI 助理(OpenClaw)。

商业差异化卖点

剥离传统 AI 仅限于“文本对话”的局限,本方案的核心技术属性在于指令执行与系统接管能力。其差异化在于提供一站式 PaaS 方案,免除了开发者搭建底层 ARM 算力集群的壁垒,通过多模态交互(自然语言+屏幕截图)实现对云端虚拟手机的自主操作。同时,支持 AI 资产的本地化私有部署,确保数据隐私可控。

二、 产品应用场景

本方案主要服务于以下两类业务场景及受众:

  1. 移动应用自动化与测试场景(面向企业开发者/架构师)
    • 痛点:大规模移动应用的自动化测试或功能调用需要复杂的 ARM 算力集群,且传统脚本维护成本高,缺乏自然语言理解能力。
    • 应用:基于 Mobile Use Agent,用户仅需通过文字或语音指令,系统即可自动完成 APP 打开、信息搜索、功能调用等各类移动端操作,实现“一言即达”的业务流自动化。
  2. 跨平台智能办公辅助场景(面向个人用户/企业员工)
    • 痛点:市面上的 AI 助手多为被动问答,缺乏长期记忆,且无法直接融入企业现有的主流即时通讯(IM)工作流中,跨平台调用繁琐。
    • 应用:在个人设备或云服务器部署 OpenClaw 作为主动式“数字管家”,执行文件整理、表单提交、代码编写等实际任务,并通过 QQ、企业微信等 IM 工具进行跨平台消息收发与推送。

三、 应用框架和功能介绍

功能框架
  • Mobile Use Agent 闭环架构:构建了以 LLM 为核心的决策反馈环路。Prompt + 手机截图输入至 LLM,LLM 输出操作指令(Metadata)给 Phone-Agent,Phone-Agent 执行指令操作云手机实例,并截取新画面进行下一轮交互。
  • OpenClaw 配置与分发框架:底层基于云手机公共镜像一键部署;中间层通过 API 接入大模型(如腾讯云 Coding Plan);应用层封装了与国内四大主流 IM(QQ、企业微信、钉钉、飞书)的安全凭证对接模块,支持通过终端命令行(/data/claw.sh)进行进程管理。
硬核指标
  • 语言环境:建议依赖 Python 3.10 或更高版本
  • 模型生态:支持接入智谱 AI(如 autoglm-phone-9b)、腾讯云 Coding Plan(内含 8 个模型:glm-5、hunyuan-2.0-instruct、hunyuan-2.0-thinking、hunyuan-t1、hunyuan-turbos、kimi-k2.5、minimax-m2.5、tc-code-latest)。
  • 通信协议与对接:支持企业微信/飞书等 IM 的 长连接(Websockets/SDK回调) 事件接收;图标支持格式为 JPEG/PNG/SVG/BMP,大小限制 2MB 以内,尺寸需 大于 240*240 px
产品优势能力
  • 免基建 PaaS 交付:无需客户搭建复杂的 ARM 算力集群环境。
  • 环境镜像持久化:支持将配置好的云手机实例环境(含 adbkeyboard 等)打包为自定义镜像,供后续创建新实例时快速批量部署相同环境。
  • 网络连通性灵活:云手机实例支持通过内网 x86 服务器或使用公网 ADB 进行安全连接。
  • 多模型兼容:支持开源模型(如 Open-AutoGLM)与自有 Agent/商业大模型的灵活接入。
  • 原生支持长期记忆:OpenClaw 具备本地存储对话数据的功能,实现隐私可控的长期上下文记忆。
  • 零代码通道接入:内置可视化配置面板,镜像已封装主流 IM 的接入功能,仅需配置 API 密钥(AppID/AppSecret 等)即可打通,无需额外开发
荣誉背书

(注:当前提供的文档材料中未包含相关的技术荣誉或奖项信息。)

四、 典型案例

(注:本文档为技术实践教程,未披露具体的第三方企业客户名称,以下按照原文提供的两个核心实施验证案例呈现最大信息量)

案例 1:Open-AutoGLM 开源模型终端操作验证案例
  1. 背景:开发者面临如何将开源多模态 AI 模型快速部署并绑定至实际物理/虚拟移动设备的工程瓶颈。
  2. 解决方案
    • 采用腾讯云手机实例,安装 adbkeyboard 虚拟输入法并开启对应权限。
    • 通过公网/内网 x86 服务器配置环境变量并使用 ADB 连接云手机节点(adb connect <实例IP>:<端口>)。
    • 克隆 Open-AutoGLM 仓库,配置智谱 AI API Key,通过 PhoneAgent 模块编写自动化脚本。
  3. 成效:成功执行自然语言指令 "打开淘宝搜索无线耳机",验证了环境连通性,云手机可精准响应 Python 脚本并完成连串的 APP 内部搜索操作。
案例 2:OpenClaw 跨平台数字管家接入案例
  1. 背景:企业或个人需要一个能无缝对接日常办公沟通工具,且具备实际任务执行能力的私有化 AI 助理。
  2. 解决方案
    • 在云手机控制台直接基于 OpenClaw 公共镜像一键创建实例。
    • 通过内置的可视化 OpenClaw配置 应用,绑定腾讯云 Coding Plan API Key 激活模型能力。
    • 在 IM 开放平台(以 QQ、企业微信、飞书、钉钉为例)创建机器人应用,获取 AppIDAppSecretClient ID,配置 长连接 接收事件,开通 im:message.receive_v1 等权限,并录入云手机通道面板。
  3. 成效:无需额外编写代码,成功在四大主流办公/社交 IM 软件内实现了直接与 OpenClaw 智能体的独立对话与任务下发,实现了极低成本的工作场景多功能覆盖

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、 产品定位与核心亮点
  • 二、 产品应用场景
  • 三、 应用框架和功能介绍
    • 功能框架
    • 硬核指标
    • 产品优势能力
    • 荣誉背书
  • 四、 典型案例
    • 案例 1:Open-AutoGLM 开源模型终端操作验证案例
    • 案例 2:OpenClaw 跨平台数字管家接入案例
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档