首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏『学习与分享之旅』

    AI浏览器自动化实战

    只需一句话,AI 即可自动操作浏览器:搜索商品:下单支付:甚至还能进行深度研究(Deep Research),自动生成完整的攻略报告:Browser use 是一个开源项目,使 AI 大模型能够自动操作浏览器 macOS-use:AI 代理(AI agents),可与 macOS 系统及其应用程序交互。 安装后用 playwright install 命令安装浏览器自动化工具及对应浏览器:playwright install接下来编写配置文件,将官方配置文件样例复制一份,命名为 .env:用 Pycharm AI 首先会打开新浏览器窗口,访问 google.com,并在搜索栏输入 “OpenAI”:项目会对每个可互动元素进行彩色标注,自动填入 OpenAI 并点击搜索按钮:一系列动作完成后,AI 自动关闭浏览器窗口 的能力边界,可以完成更多复杂的自动化操作。

    2.6K41编辑于 2025-04-16
  • 来自专栏星哥的AI自留地

    浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍

    浏览器自动化工具!开源AI浏览器助手让你效率翻倍前言在AI自动化快速发展的当下,浏览器早已不再只是“用来点点点”的工具。 它不仅免费、开源,还能在本地浏览器中直接运行AI自动化流程,让网页操作真正做到“像人一样执行”。如果你正在寻找一款安全、灵活、可控的浏览器自动化工具,那么它绝对值得一试。Nanobrowser是什么? 相比传统的脚本自动化(如Selenium),Nanobrowser更像是“AI驱动的智能浏览器助手”,无需写代码即可完成复杂任务。 总结Nanobrowser作为一款开源、免费、隐私友好的AI浏览器自动化工具,正在重新定义网页操作方式。 如果你想体验真正的AI自动化浏览器,不妨试试Nanobrowser。

    67510编辑于 2026-01-05
  • 1949AI轻量化AI自动化实战:本地自动化工具、浏览器自动化与Agent自动化工具Python落地

    今天就结合1949AI的轻量化设计思路,实战拆解本地自动化工具、浏览器自动化、Agent自动化工具的Python实现,全程干货无营销,新手也能跟着上手。 三、实战2:浏览器自动化(1949AI轻量化无界面实现)浏览器自动化是高频需求(如网页数据采集、批量登录、表单提交),但传统浏览器自动化驱动笨重、资源占用高。 四、实战3:Agent自动化工具(1949AI风格任务调度中枢)当本地自动化浏览器自动化任务增多时,分散管理效率低下。 、浏览器自动化)classLocalAutoConfig:BASE_DIR=Path.home()/"1949ai_local_auto"MAX_MEMORY=128TASK_TIMEOUT=10@classmethoddefinit_env 五、实战总结与注意事项本次实战完全遵循1949AI的轻量化设计思路,围绕本地自动化工具、浏览器自动化、Agent自动化工具,实现了一套适配个人开发者和小型技术团队的轻量化自动化解决方案,核心亮点如下:轻量部署

    17610编辑于 2026-03-16
  • 来自专栏FunTester

    AI + 浏览器自动化:qa-use 上手指南

    它借助大型语言模型(LLM),能理解自然语言描述的测试用例,自动驱动浏览器完成真实操作,实现 AI 驱动的端到端测试(AI-Driven E2E Testing)。 验证页面中是否包含文字订单列表 AI 会自动启动浏览器,理解每一步的意图,查找并操作 DOM 元素,执行断言并生成报告。整个过程就像请了个懂技术的测试助理,帮你把繁琐的操作和验证都自动化搞定。 你可以把它理解为一个自动化测试 SaaS 平台,前端负责用例管理和结果展示,后端负责调度、存储和 AI 执行,AI Agent 层则是整个系统的大脑,负责解析自然语言、生成操作序列并驱动浏览器。 整体架构如下: 系统分为前端、后端和 AI Agent 三层:前端负责用例管理与结果展示,后端处理测试请求、调度与存储,AI Agent 基于大模型解析自然语言并自动驱动浏览器,实现端到端智能化自动化测试 无论是自动化平台还是自研工具,都能无缝集成 AI 测试能力,极大提升测试自动化和智能化水平。

    89210编辑于 2025-10-21
  • 1949AI轻量化AI自动化 本地自动化工具浏览器自动化Agent自动化工具 模拟打字机实现

    在轻量化AI自动化实践中,模拟打字场景应用广泛,其核心需求是模拟人类打字行为,包含打字速度、错字概率、纠错动作等细节,适配浏览器自动化、本地自动化工具的商业落地场景,无需复杂部署,可在低配置设备上稳定运行 以下为Python实现模拟打字的核心代码,包含完整的参数配置,可直接用于本地自动化浏览器自动化的场景适配。 自动化可适配本地自动化工具、浏览器自动化场景,实现自动化落地。" 、Agent自动化工具中,适配浏览器自动化的文本输入场景。 轻量化AI自动化体系中,此类模拟工具可对接各类自动化组件,市面上存在如1949AI这类轻量化AI自动化辅助工具,具备稳定可靠、资源占用低、部署轻量、运行安全合规的特性,可适配相关自动化场景的集成需求。

    15310编辑于 2026-03-18
  • 用Playwright MCP让AI帮你完成所有浏览器自动化

    :你只管努力,剩下的交给时间 :小破站 用Playwright MCP让AI帮你完成所有浏览器自动化 前言:告别那些痛苦的“选择器地狱”吧! 这不仅仅是效率的提升,更是自动化体验的飞跃。 什么是 Playwright MCP? ✅ 定义 Playwright MCP 是 Microsoft 基于 Playwright 自动化框架 开发的 AI驱动协议,其目标是: 让大型语言模型(LLM)能够像人类一样,通过结构化语义而不是像素截图与网页交互 ✅ 技术栈组成 组件 说明 Playwright 跨浏览器自动化框架,支持 Chromium、Firefox 和 WebKit MCP 协议 标准化语言模型与工具交互方式,统一指令格式 LLM(GPT/ 场景:自动化任务完成后清理环境。 示例:browser_close() → 关闭浏览器,释放资源。 2. browser_resize 功能:调整浏览器窗口大小(支持像素或设备预设)。

    2.8K11编辑于 2025-08-15
  • 来自专栏AllTests软件测试

    Skyvern - 用AI实现基于浏览器的工作流程自动化

    1、前言 数字化快速发展的当下,AI 技术正深刻重塑各行业,对 AI 驱动的高效智能自动化工具需求激增。 企业繁琐流程处理与复杂业务精准操作,都亟需依托 AI 突破传统局限的灵活智能工具—— AI 技术的融入让自动化工具更具适应性与决策力。 Skyvern 应需而生,依托 AI 赋能的创新技术和独特功能,为自动化领域带来新可能。 2、简介 Skyvern 借助大语言模型(LLMs)与计算机视觉,实现基于浏览器的工作流程自动化。 传统浏览器自动化方案需要为各网站编写自定义脚本,通常依赖 DOM 解析和基于 XPath 的交互——一旦网站布局发生变化,这些方案就会失效。 工作原理: Skyvern 的灵感源自 BabyAGI 与 AutoGPT 推广开来的任务驱动型自主智能体设计,且具备一项核心优势:赋予 Skyvern 借助 Playwright 等浏览器自动化库与网站进行交互的能力

    75810编辑于 2025-12-25
  • 来自专栏开源服务指南

    解放双手:借助 AI 完成浏览器自动化! | 开源日报 No.313

    Skyvern-AI/skyvernhttps://github.com/Skyvern-AI/skyvern Stars: 5.5k License: AGPL-3.0 skyvern 是使用 LLMs 和计算机视觉自动化基于浏览器的工作流程。 提供简单的 API 端点,完全自动化手动工作流程 添加了计算机视觉和 LLMs 来解析实时视口中的项目,并与之交互 可以在从未见过的网站上操作,无需定制代码 抵抗网站布局更改,没有预先确定的 XPaths 框架,专为研究大型语言模型、多模态和语音 AI(自动语音识别和文本到语音)的研究人员和开发人员构建。 的主要功能、关键特性和核心优势包括: 支持大型语言模型和多模态 提供预训练模型和优化增强 支持混合专家和强化学习 可在任何云和本地环境中进行开发和扩展 可以加速语音识别的准确性和速度 deepseek-ai

    99110编辑于 2024-07-31
  • 来自专栏AllTests软件测试

    Embtion - 网页浏览器自动化

    1、前言 在数字化办公与数据处理日益频繁的今天,重复的网页操作(如批量点击、数据录入、信息抓取)往往耗费大量时间,而专业的自动化工具又多依赖编程技能,让普通用户望而却步。 这时,一款名为 Embtion 的网页浏览器自动化工具应运而生,它以“无代码、易操作、功能全”的核心优势,为不同需求的用户提供了高效解决方案。 2、简介 Embtion 是一款免费、无需编码的网页浏览器自动化工具,以浏览器扩展形式支持 Edge 和 Chrome,通过连接节点即可实现任意网站的点击、输入等自动化操作,拥有多种节点且无需依赖 API 核心功能: 自动化覆盖范围:支持任意网站的自动化操作,无网站类型限制。 可实现操作:基础自动化动作(如点击、输入等常见网页交互操作)。 节点支持:提供多种节点,满足不同场景下的自动化需求。 高级拓展功能:支持高级JavaScript模式,允许用户在网页上运行自定义JavaScript代码,拓展自动化能力。 主要适用场景: 数据抓取:从目标网站提取所需数据。

    100编辑于 2026-04-15
  • 来自专栏软件

    selenium实现浏览器自动化

    selenium // 最好设置你安装的python位置 $ pip install selenium --target=E:\python3.10.4\Lib\site-packages 安装Chrome浏览器驱动 Chrome 浏览器驱动下载地址 需要选择与当前浏览器版本匹配的版本 自动化打开浏览器 from selenium import webdriver from selenium.webdriver.chrome.service import Service # 需要自动打开的网站 url = 'https://www.baidu.com' # 创建 WebDriver 对象,指明使用chrome浏览器驱动 wd = webdriver.Chrome (service=Service(r'd:\chromedriver.exe')) # 调用WebDriver 对象的get方法 可以让浏览器打开指定网址 wd.get(url) 利用自动化在百度搜索需要的信息就需要学习一下基本的操控元素的方法

    60520编辑于 2022-08-18
  • 来自专栏软件安装

    这个 AI 浏览器自动化项目火了

    浏览器自动化的新纪元 在 Web 自动化领域,开发者们长期面临着一个令人头疼的问题:精心编写的自动化脚本往往因为网页改版而突然失效。 这个在 GitHub 上获得超过 15000 Star 的自动化浏览器工具,通过引入 AI 技术,为浏览器自动化带来了全新的解决方案。 传统方案的困境 传统的浏览器自动化工具(如 Selenium)依赖于精确的元素定位器——XPath、CSS 选择器等。开发者需要仔细分析页面结构,为每个需要操作的元素编写定位规则。 最后说一下 Skyvern 代表了浏览器自动化技术的新方向,它用 AI 的智能理解替代了传统的硬编码方式,极大地提高了自动化脚本的适应性和维护性。 随着多模态大语言模型技术的不断成熟和成本的逐步下降,这种 AI 驱动的自动化方式很可能成为未来的主流。

    23210编辑于 2026-03-26
  • 来自专栏生信修炼手册

    使用selenium自动化操作浏览器

    selenium是一个浏览器自动测试工具,通过驱动程序来自动化操作对应的浏览器,包括了打开浏览器窗口,定位元素,点击按钮,上传文件等操作,支持以下多款主流浏览器 ? selenium借助驱动程序webdriver来驱动相应的浏览器,以最常用的谷歌和火狐浏览器为例,对应的驱动程序如下 1. chromdriver, 谷歌浏览器的驱动程序 2. geckodriver, 在浏览器之中,有一个特殊的浏览器,称之为无头浏览器PhantomJS, 是一个没有GUI界面的浏览器,原生支持命令行运行模式,非常实用linux服务器上的自动化。 在爬虫程序中,通过自动化操作浏览器,来模拟真实用户的浏览操作,避开了动态资源解析的难点,使得程序的结果和我们在浏览器中获得的结果完全一致,所以selenium是爬虫的一大利器,是解决动态页面的终极武器, 填写文本框或者上传文件 2. submit, 提交表单 3. select_by_index, 选择下拉列表 4. save_screenshot, 保存网页截图 下面是一个简单的案例,通过selenium来自动化操作百度检索

    1.3K20发布于 2020-11-02
  • 来自专栏ceshiren0001

    Playwright MCP浏览器自动化指南

    这篇文章将一步步带你配置和使用 Playwright MCP,让AI真正成为你的浏览器自动化助手——从此不是你围着它转,而是它主动为你“打工”。一、什么是Playwright MCP?为什么你需要它? Playwright MCP是一个基于Model Context Protocol的服务器,它在大语言模型(LLM)和Playwright浏览器自动化框架之间架起了一座桥梁。 AI会自动操作浏览器执行登录,查看错误信息,分析问题原因,并提供修复方案。五、最佳实践与技巧明确指令:给AI的指令越明确,自动化效果越好。 Playwright MCP真正实现了自然语言到浏览器操作的转换,将自动化测试、数据抓取和网页操作的复杂度降到了最低。 它不仅能够大幅提升开发效率,减少在手动测试和调试上的时间消耗,还让不会编程的人也能通过自然语言指挥浏览器完成自动化任务。

    2.5K11编辑于 2025-09-15
  • 使用Selenium自动化操作浏览器

    Selenium可以自动化操作浏览器,例如:选择元素,输入,点击等,可以用于软件自动化测试,爬虫等工作,也可以做你想做的任何事情。 自动化框架Appium也是基于WebDriver协议传输指令。 此种方式需要初始化驱动时配置浏览器和驱动的路径,后文会有介绍。                     value='//*[@id="accept-choices"]') accept_button.click() 执行JS脚本 在使用 Selenium 进行自动化测试时 # 'rgb(255, 105, 180)' # 判断元素的颜色 assert login_button_background_colour == HOTPINK 总结: 本文描述了Selenium自动化操控浏览器的原理

    95710编辑于 2025-07-14
  • 来自专栏AgenticAI

    OpenAI正式推出智能体Operator:让AI帮你自动化浏览器任务

    今天OpenAI正式推出Operator,一款能够通过自身浏览器为你自动化执行任务的智能助手,让这一切成为可能。 如何使用Operator? 使用Operator非常简单。 这使得Operator无需依赖复杂的API集成,就能直接在浏览器中操作,极大地拓展了AI的应用场景。他们计划很快将CUA开放到API中,供开发者创作自己的智能体。

    39800编辑于 2025-03-18
  • 来自专栏用户1880875的专栏

    使用 Selenium 自动化 Web 浏览器

    Selenium 是浏览器自动化的绝佳工具。使用 Selenium IDE,你可以录制命令序列(如单击、拖动和输入),验证结果并最终存储此自动化测试供日后使用。这非常适合在浏览器中进行活跃开发。 此例使用了 Selenium 的独立容器,其中包含 WebDriver 服务器和浏览器本身。 这不仅有助于加快速度,还允许你同时测试多个不同的浏览器。 它允许你自动化与网站的交互,以及测试交互。Podman 允许你在没有超级用户权限或 Docker 守护程序的情况下运行所需的容器。 最后,Python 绑定允许你使用普通的 Python 代码与浏览器进行交互。

    2.8K30发布于 2021-09-23
  • 来自专栏测试人生

    Web自动化浏览器启动

    二、Chrome浏览器启动 1、下载Chromedriver 从https://chromedriver.storage.googleapis.com/index.html,下载ChromeDriver 2、启动Chrome浏览器 示例代码: /** * 启动Chrome浏览器 */ @Test public void testChrome(){ 2、启动Firefox浏览器 示例代码: /*** * Firefox浏览器启动 */ @Test public void testFireFox 2、去掉启用保护模式 3、启动IE浏览器 示例代码: /** * IE浏览器启动 */ @Test public void testIE(){ 3、启动edge浏览器 示例代码: /** * edge浏览器启动 */ @Test public void testEdge(){

    88540发布于 2021-07-30
  • 来自专栏学习

    手把手教你实现:AI浏览器自动化操作,实践操作(保姆级教程)

    它是 IT 专业人士(特别是系统管理员、DevOps工程师)以及需要自动化任务的用户的必备工具。 ​​ : playwright install --with-deps Playwright​​ 是由 Microsoft 开发的​​现代化 Web 自动化测试框架​​,专门用于实现浏览器操作的自动化(如爬虫 其核心特点是通过单一 API 控制多种浏览器,且支持跨平台运行 --with-deps 是 Playwright 的"完整安装模式",一次性解决所有环境依赖问题,确保浏览器能正常运行。 然后找到我们后缀为.env.example的文件复制一份,然后后缀改为.env 选择的API提供商:openRouer 点击API复制我们openRouer的地址 https://openrouter.ai ,最后点击搜索; 这里就是具体的对话框,执行过程如下所示: ️4.总结 本期主要是讲解了关于我们browser启用AI来控制我们的浏览器 网址:https://github.com/browser-use

    1.2K10编辑于 2025-06-08
  • 来自专栏ceshiren0001

    新手指南:通过 Playwright MCP Server 为 AI Agent 实现浏览器自动化能力

    本文将带你从零开始,一步步将浏览器自动化能力赋予你的AI Agent,让它从一个被动的知识库转变为一个能主动执行任务的数字助手。一、 基础概念:什么是MCP和Playwright? PlaywrightPlaywright是一个现代化的浏览器自动化库,支持Chrome、Firefox、Safari等主流浏览器。它比传统的Selenium更快速、更可靠,特别适合处理现代Web应用。 Playwright MCP Server这就是连接AI浏览器的桥梁! 你现在已经成功为AI Agent赋予了浏览器自动化能力。 Server实现端到端自动化现在就开始你的AI自动化之旅吧! 

    2K00编辑于 2025-10-14
  • 来自专栏bit哲学院

    Selenium自动化测试-浏览器基本操作

    参考链接: 使用Selenium的浏览器自动化 ——————·今天是2020年第32天·——————  这是ITester软件测试小栈第95次推文  在此之前我们已经搭建好selenium环境  今天给大家介绍浏览器的基本操作  所谓浏览器操作是指webdriver 通过协议和接口发现DOM中的元素,并实现控制浏览器的行为,例如打开浏览器、控制浏览器大小、浏览器刷新及浏览器前进、后退等,接下来介绍浏览器的这些基本操作。   6.浏览器前进  driver.forward(),用于前进到下一步操作  浏览器会依次:初次打开浏览器--打开百度页面--回退到初次打开的浏览器页面--前进到百度页面。   APP测试之Monkey压力测试(一)  APP测试之Monkey压力测试(二)  Python接口自动化-接口基础(一)  Python接口自动化-接口基础(二)  快来星标 置顶 关注我   后台 回复资源取干货  ITester软件测试小栈  软件测试技术分享栈  功能测试|自动化测试|专项测试|测试开发  想要获取相关资料和软件 ?  

    79100发布于 2021-01-01
领券