首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 腾讯云手机 Mobile Use Agent 与 OpenClaw 架构及部署应用解析

    一、 产品定位与核心亮点 技术定义: 基于 LLM大模型 + GUI Agent + 云手机 PaaS 架构的移动端智能体执行环境与个人AI智能助理解决方案。 大模型私有化部署测试:针对开发者需验证自研 Agent 或开源大模型(如 Open-AutoGLM)落地能力的场景,提供即开即用、可内网连接的标准化云端虚拟设备。 三、 应用框架和功能介绍 1. 功能框架 Mobile Use Agent 执行闭环:构建了“用户Prompt下发 -> LLM 核心解析 -> Phone-Agent 指令转换 -> 云手机实例接收指令与回传截图”的数据双向交互架构 高度开放与定制化:支持开发者接入自有 Agent 及模型;并支持将配置好的复杂环境(如安装好 adbkeyboard 及 ADB 变量的环境)打包为自定义镜像,实现后续同类实例的快速秒级克隆。 案例一:基于 Open-AutoGLM 的电商应用自动化检索 背景:验证 Mobile Use Agent 在真实云手机环境中,对自然语言转化为多模态 UI 交互指令的执行准确度。

    30620编辑于 2026-03-20
  • 来自专栏用户4822892的专栏

    Why Use React Native for Your Mobile App Development in 2020

    Why Use React Native for Your Mobile App Development in 2020? What is react native and why to use it? Why Use React Native for Your Mobile App Development in 2020? Getting started with react native. Why to use React Native? React Native for mobile app development. There are a lot of companies that use React Native.

    67500发布于 2020-04-11
  • 来自专栏智能体

    OpenClaw爆火,Computer Use Agent爆发

    除了CUA,还有这些类型理解了CUA,有必要把整个AIAgent的物种图谱摆出来,主要在于这些类型的Agent之间容易混淆。 这一步让OpenClaw的自主能力远超市面上那些在沙盒里谨慎运作的同类产品,技术圈一度称之为「桌面Agent里的AGI表现」。 信息窃取软件收割的不只是密码,而是完整的AI配置文件加上加密「骨架密钥」,直接把一个被入侵的Agent变成全账户接管的跳板。 Agent帮你「看」一个网页的时候,网页里可能埋着隐藏的恶意指令。Agent在浏览的同时被悄悄控制了,攻击者甚至不需要和你直接交互。门槛比你以为的低很多。 这个趋势如果持续,五年后Agent能处理的任务范围,远超现在的想象。

    76420编辑于 2026-03-12
  • 来自专栏猫头虎博客专区

    在AI 智能体Agent行业:什么是computer-use和 broswer-use

    近年来,随着大语言模型(LLM)和自主代理(Agent)技术的迅速发展,越来越多的企业和研发团队开始探索如何利用 AI 自动化日常任务。 其中,“computer-use”与“browser-use”作为两种不同的应用模式,正逐渐成为业界关注的焦点。本文将深入解析这两种模式的概念、实现原理、应用场景以及未来的发展趋势。1. 概念解析1.1 computer-use:操控整台计算机的 AI 代理computer-use 模式指的是 AI 代理通过操作操作系统层面的接口和工具,实现对整台计算机的控制。 许多系统可能同时具备 computer-use 与 browser-use 的能力,实现端到端的自动化操作。 总结在 AI Agent 行业中,“computer-use”和“browser-use”代表了两种不同的代理实现路径:前者注重对整个计算机系统的全局控制,后者则专注于在浏览器环境中的任务自动化。

    2.4K10编辑于 2025-03-07
  • 来自专栏AI前沿技术

    智能体|Agent Tool Use 技术演进路线

    注意:Function Calling 本身没有统一协议,不同厂商实现方式不同(如 OpenAl 的 tools 参数、Claude的 tool_use 字段)。 图3,A2A交互示意图 A2A(Agent to Agent)解决是Agent 之间通信的问题,是一项开放标准,可让不同平台和框架之间的Al Agent 进行通信和协作,而无需考虑其底层技术。 Agent可以调用不同的工具,为什么还需要多个Agent? 因为构建一个能解决所有问题的Agent 很难,或者说基本不可能实现,因此一般选择多Agent 分工协作,每个 Agent 只需要专注某一方面解决,通过A2A让多个不同领域的Agent 协作解决问题,多个 A2A像一门统一的语言,让Agent ”说人话“,清晰的传递意图、协商任务、共享信息。能够连接任何其它的基于 A2A构建 Agent,并使用户能够灵活组合来自不同供应商的Agent

    23010编辑于 2026-02-03
  • 来自专栏机器之心

    你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞

    该测试基准全面地评估了 Computer-Use Agent 在真实电脑使用场景中可能面临的安全风险,并表明当前阶段的 CUA 作为自动化电脑使用助手仍然面临着突出的安全风险。 风险类别缺乏全面性、多样性,仅关注个别的风险或攻击类型,从而限制了对 Computer-Use Agent 的全面风险评估。 这种全面的覆盖致力于能够有效和全面地评估 computer-use agent 在各个方面的安全风险。 评估方法  RiOSWorld 从两个维度评估 MLLM-based Computer-Use Agent 的不安全/有风险行为: Risk Goal Intention:Agent 是否有意图执行风险行为 它不仅揭开了 Computer-Use Agent 的安全遮羞布,更为未来指明了方向:没有安全兜底的 AI,再强大也是「空中楼阁」! 转发提醒身边的 Computer-Use Agent 爱好者!

    41510编辑于 2025-07-02
  • 来自专栏SIGAI学习与实践平台

    AutoML for Mobile Compression and Acceleration on Mobile Devices

    .: Mobilenets: Efficient convolutional neural networks for mobile vision applications. arXiv preprint Choi, T., Yang, L., Shin, D.: Compression of deep convolutional neural networks for fast and low power mobile CoRR, abs/1611.06440(2016)AMC: AutoML for Model Compression and Acceleration on Mobile Devices 17 39. :Invertedresidualsand linear bottlenecks: Mobile networks for classification, detection and segmentation Chen, B., Zhang, X., Go, A., Sze, V., Adam, H.: Netadapt: Platform-aware neural network adaptation for mobile

    2.7K30发布于 2019-05-07
  • 来自专栏机器之心

    一句指令自动玩手机,网上冲浪神器Mobile-Agent来了

    本文将介绍一篇最新的利用多模态 agent 实现 AI 操作手机的研究《Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual 在该例子中,Mobile-Agent 出现了两次错误的操作(红色字体指示),然而 Mobile-Agent 及时感知到了错误并且采取了补救措施,最终也完成了任务。 从上述的例子中可以看出,Mobile-Agent 有以下三个能力: (1)操作定位。对于需要点击特定图标和文本的操作,Mobile-Agent 能够准确点击到对应的位置。 (2)自我规划。 在 Mobile-Agent 中,一共使用了两种视觉感知工具,分别是文字识别模块和图标识别模块,如下图所示: 对于文本定位,Mobile-Agent 借助 OCR 工具来定位出指定文本。 自我反思 在迭代过程中,Mobile-Agent 可能会遇到错误,导致无法完成指令。为了提高指令的成功率,Mobile-Agent 引入了一种自我反思方法。这种方法将在两种情况下生效。

    82310编辑于 2024-02-06
  • 来自专栏全栈程序员必看

    Wireless and Mobile

    They all: 1) use CSMA/CA for multiple access 2) have base-station and ad-hoc network versions 3.1 Then correspondent transfers pkt to mobile through home agent. And a new mobile will put out registration request to foreign agent. And then foreign agent forwards the request to the home agent and gets the reply for the mobile. NOTE: Mobile maintains the home agent address consistantly. 3 Handoff within Mobile Switching

    67720编辑于 2022-07-07
  • Mobile-Agent-基于多模态大模型(MLLM)的视觉驱动型GUI智能体

    目前,Mobile-Agent已迭代至v3版本,开源地址为: https://github.com/X-PLUG/MobileAgent 相关论文包括: Mobile-Agent: https:// arxiv.org/abs/2401.16158 10 Mobile-Agent-v2: https://arxiv.org/abs/2406.01014 Mobile-Agent-E: https:/ Mobile-Agent-E引入“经验记忆库”,记录高频路径并生成快捷方式(Shortcut)。 快速上手指南(含完整代码) 以下是一个基于Mobile-Agent-E的实战教程,教你如何运行第一个自动化任务。 1. conda create -n mobile_agent_e python=3.10 -y conda activate mobile_agent_e # 安装依赖 pip install -r requirements.txt

    91410编辑于 2026-01-14
  • 来自专栏机器之心

    Mobile-Agent-v2问世,自动化手机操作能力再上新台阶

    目前,Mobile-Agent-v2的论文和代码均已发布。 ,ModelScope-Agent已经可以通过调用Mobile-Agent-v2可以完成自动化打车任务。 另外,在初代Mobile-Agent中评测的那些相对基础的任务,例如安装应用、导航去某个地点等,Mobile-Agent-v2也能完成。 Mobile-Agent-v2可以根据帖子的内容发布相关的评论,也能根据微信消息的内容生成相关的回复。 下面将介绍Mobile-Agent-v2的技术实现。 如下图所示,通过分析操作失败的任务,作者发现Mobile-Agent的失败操作大量集中在任务的后期,而Mobile-Agent-v2的失败操作则较为平均分布。

    58210编辑于 2024-06-17
  • 来自专栏业余草

    jQuery Mobile中$.mobile.buttonMarkup方法使用详解

    最近在群里遇到多数网友提到$.mobile.buttonMarkup()方法的使用。我这里就列了一下api的使用说明,以后大家看博客就能解决问题。如有不正确的地方,请留言指出! jQuery Mobile暴露的方法都是使用$.mobile来引用。 $.mobile.buttonMarkup( options, overwriteClasses ) 添加按钮的样式元素 其中options为对象,overwriteClasses为布尔类型,默认为false

    1K20发布于 2019-01-21
  • 来自专栏施炯的IoT开发专栏

    Windows Mobile Ink

        在之前的文章“Signature on Pocket PC”中,是将签名作为bmp位图的格式存放在Windows Mobile设备的某一个目录下面。 今天看到了这个叫做Mobile Ink的东西,觉得比当时的Signature要强大很多。至少,Signature只是Mobile Ink中的一部分。          Windows Mobile Ink是Windows Mobile 6 Professional 和 Windows Mobile 6 Classic上Ink的服务平台。 具体情况可以参考MSDN上的Ink介绍:Windows Mobile Ink。     在OpennetCF主页上下载了SmartDeviceFramework,想不到里面也有关于Mobile Ink的东西。

    1.3K50发布于 2018-01-11
  • 来自专栏我爱计算机视觉

    全新Mobile-Agent-v2发布,自动化手机操作助手全面升级!

    根据魔搭团队发布的演示视频,ModelScope-Agent拥有了使用Mobile-Agent-v2完成自动化打车的能力。 首先,用户需要Mobile-Agent-v2查看聊天软件中的未读消息并执行相关任务。 Mobile-Agent-v2根据指令先打开了WhatsApp,查看了来自 "Ao Li" 的消息。 然而,从视频中可以看到,Mobile-Agent-v2精准地执行了每一步操作。尤其是在点击关注按钮后,推荐用户弹窗遮挡了原推文,但Mobile-Agent-v2通过上划屏幕,顺利完成了评论任务。 从结果中可以看出,Mobile-Agent-v2在多项指标上,无论在英文还是非英文场景,都表现出了全面的提升。此外,通过人为增加操作知识(Mobile-Agent-v2 + Know.) 随后,通过对操作失败任务的分析(如下图所示),作者发现Mobile-Agent在任务后期失败的操作占比较高,而Mobile-Agent-v2则显示出更均匀的失败分布,这表明Mobile-Agent-v2

    1.2K10编辑于 2024-06-17
  • 来自专栏cnblogs

    use vue vuex vue-router, not use webpack

         vue,vuex,vue-router放在一起能做什么?不用webpack之类的打包工具使用他们是否可行?各位道友在初学vue时是否有这样的困惑。因为现代构建前端项目的一般模式是: 安装webapck,某种是glup,grunt,或者是fis等构建工具 然后安装一个包管理器,npm,bower,或者说是新一代:yarn 再然后用 包管理器 安装各种各样的包,如:vue,bootstrap,vuex等。 其后用es6的import或者是node的require引入包 最后通过 构建工具 打包或发布项

    1.5K80发布于 2018-01-17
  • 来自专栏业余草

    jQuery Mobile中jQuery.mobile.changePage方法使用详解

    jQuery.mobile.changePage方法用的还是很多的。作为一个老手,有必要对jQuery mobile中实用方法做一些总结。 系列文章请看jQuery Mobile专栏。jquery.mobile.changepage是过时的jQuery Mobile 1.4.0及将被删除在1.5.0。 jQuery.mobile.changePage( to [, options ] )参数解释说明: to:字符串类型或Object类型,将要跳转到的目的页面。 $.mobile.changePage( ".. changepage来加载第三个页面 $.mobile.changePage([$.mobile.activePage.data ('ui.prevPage'), anotherPreviousPage

    2.4K20发布于 2019-01-21
  • 来自专栏我爱计算机视觉

    一句指令帮你操作手机,最新多模态手机助手Mobile-Agent来了!

    ,今天来介绍一个用多模态agent实现手机操作助手的工作Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception 操作空间 我们首先介绍Mobile-Agent的操作空间。为了便于将文本描述的操作转化为屏幕上的操作,Mobile-Agent生成的操作必须在一个定义好的操作空间内。 在每次迭代开始时,Mobile-Agent会获取手机屏幕的截图,通过观察系统提示、操作历史和当前屏幕截图,输出下一步操作。 如果Mobile-Agent输出的是结束,则停止迭代;否则,继续新的迭代。 实验结果 下表中展示了Mobile-Agent的评测结果。 其中SU代表指令是否完成,PS代表正确操作占所有操作的比例,RE代表Mobile-Agent和人类完成指令时分别用了多少步,CR是Mobile-Agent能够完成的操作占人类操作的百分比。

    1.6K10编辑于 2024-02-06
  • 来自专栏施炯的IoT开发专栏

    Endnote for Windows Mobile

    安装了以后,发现Endnote还提供了移动设备上的程序,特别是Windows mobile和Palm的版本。于是乎心里大喜,以后在我WM手机上又多了一项功能--参考文献学习。 它是基于.NET CF2.0的,所以在安装Endnote for WM之前,会先安装.NET CF2.0,当然还有Microsoft SQL Mobile 2005和Microsoft SQL Client

    1.1K60发布于 2018-01-11
  • 来自专栏Web 开发

    Design For Mobile Web

    <meta name="viewport" content="width=640px"> 这样,设计Mobile Web页面的时候,只需要按照640px的宽度进行设计就可以了。 -- status bar styles: default, black, or black-translucent --> <meta name="apple-<em>mobile</em>-web-app-status-bar-style -- hides browser chrome --> <meta name="apple-mobile-web-app-capable" content="yes" />   <!

    92800发布于 2018-08-08
  • 来自专栏潇涧技术专栏

    Material on Mobile Development

    1.Android开发者:http://developer.android.com/index.html Google官方Android开发者网站,发布关于Android的最新信息,有最权威的开发教程和API手册以及应用设计教程,还提供最新最强大的开发工具以及SDK下载!

    1.6K20发布于 2018-08-01
领券