首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >刚刚开源就斩获 3.2K Star!Browser Use 团队推出极简自愈式浏览器自动化框架!

刚刚开源就斩获 3.2K Star!Browser Use 团队推出极简自愈式浏览器自动化框架!

作者头像
开源星探
发布2026-04-22 20:30:37
发布2026-04-22 20:30:37
2090
举报
文章被收录于专栏:翩翩白衣少年翩翩白衣少年

从去年开始,AI Agent 火得一塌糊涂。

从 AutoGPT 到各种浏览器自动化工具,大家都在做同一件事:让AI替人类操作网页

但用过这类工具的人都知道,现实远比想象骨感。

传统的浏览器自动化,本质上是在"教AI用人类的方式上网"——开发者预先写好一堆工具函数,定义好每一步该点哪里、填什么。AI只是一个执行者,按部就班地调用这些预设好的能力。

这种模式有个致命缺陷:互联网是活的。网页每天都在变,新的交互形式层出不穷。预置的工具函数永远追不上现实世界的复杂度。

就在前几天,GitHub 明星项目 Browser Use(GitHub上88k+ Star的浏览器自动化框架)团队,扔出了一个堪称"反常识"的实验性项目——Browser Harness

他们没有选择继续堆功能、加适配,而是做了一件极其大胆的事:

把控制权完全交给AI,让Agent自己在任务过程中写代码、补功能、沉淀经验。

整个项目只有 592 行 Python 代码。没有框架,没有预设流程,没有复杂配置。就是一根 WebSocket 直连 Chrome,然后让 AI 自己发挥。

开源没几天就已经收获了 3.2K Star,反响剧烈!

项目简介

Browser Harness 是 Browser Use 团队开源的一个实验性项目,定位为"最简单、最轻量、自愈式的浏览器控制工具"。

与传统的浏览器自动化工具不同,Browser Harness 不依赖任何中间框架,也不需要开发者预先写好流程模板。它直接通过 WebSocket 连接 Chrome 浏览器,整个核心代码只有区区 592 行 Python 代码。

这个项目的特点可以用三个"无"来概括:

  • 无框架:没有复杂的抽象层,直接基于 Chrome DevTools Protocol (CDP)
  • 无预设:没有固定的流程模板,AI 完全自主决定如何完成任务
  • 无约束:没有限制性的"护栏",AI 可以自由探索和尝试

这种极简的设计理念,让 Browser Harness 展现出了惊人的灵活性和强大的自愈能力。

核心亮点

1、实时补充功能,边做边写

Browser Harness 最令人惊叹的特性是它允许 AI 在任务执行过程中实时编写缺失的功能。

这个过程完全自动进行,不需要人工干预。AI 会根据任务需求,当场补充需要的功能,真正做到了"遇到问题,解决问题"。

2、自动沉淀技能,越用越聪明

除了实时编写功能,Browser Harness 还能自动将学到的操作路径沉淀为技能文件。

当 AI 完成一个任务后,它会总结这次任务中学到的经验,包括:

  • • 网站的选择器
  • • 操作流程
  • • 边界情况处理

这些经验会被保存到 domain-skills/ 目录下,下次遇到同类网站或任务时,AI 就可以直接复用这些技能,无需重新摸索。

项目中已经内置了一些现成的技能文件,包括 GitHub、LinkedIn、Amazon 等常见网站,你可以直接参考使用。

3、即插即用,适配主流 AI 工具

Browser Harness 的设计非常友好,可以直接适配 Claude Code 和 Codex 等主流 AI 编程工具。

你只需要按照项目提供的 setup prompt 粘贴到 Claude Code 或 Codex 中,AI 就会帮你完成安装和配置,然后就可以开始使用了。

技术架构

Browser Harness 的代码结构极其精简,整个项目只有几个核心文件:

文件

行数

功能

install.md

-

首次安装和浏览器引导文档

SKILL.md

-

日常使用说明

run.py

~36行

预加载 helpers 的纯 Python 运行脚本

helpers.py

~195行

初始工具调用集合,AI 会编辑这些

admin.py + daemon.py

~361行

守护进程引导 + CDP WebSocket 和套接字桥接

总计:592行 Python 代码!

这就是 Browser Harness 全部的核心代码。没有复杂的依赖,没有层层封装,一切都尽可能保持简单和透明。

技术栈

Browser Harness 直接基于 Chrome DevTools Protocol (CDP) 构建,通过一个 WebSocket 连接直接与 Chrome 浏览器通信,中间没有任何额外的框架层。

这种架构带来了几个显著的优势:

  • 高性能:没有中间层的开销,通信延迟极低
  • 透明:可以直接看到和控制所有浏览器操作
  • 灵活:不受框架限制,可以实现任何浏览器功能
  • 轻量:代码量极小,易于理解和修改
快速上手

Browser Harness 的安装非常简单,主要步骤如下:

  1. 1. 阅读 install.md:首先阅读项目中的 install.md 文件,了解如何安装和连接浏览器
  2. 2. 阅读 SKILL.md:然后阅读 SKILL.md 了解日常使用方法
  3. 3. 阅读 helpers.py:务必阅读 helpers.py,因为这是函数存放的地方
  4. 4. 粘贴 setup prompt:将项目提供的 setup prompt 粘贴到 Claude Code 或 Codex 中
  5. 5. 完成配置:AI 会帮你完成剩余的安装和配置工作

项目还提供了免费的远程浏览器服务,非常适合子代理或部署场景:

  • • 免费套餐:3个并发浏览器
  • • 可以在 cloud.browser-use.com/new-api-key 获取 API Key
  • • 也可以让 AI 通过 docs.browser-use.com/llms.txt 自行注册
写在最后

Browser Harness 用 592 行代码向我们展示了一个全新的浏览器自动化范式。

它不是另一个 Selenium 或 Playwright,而是一个完全不同的思路:

  • 极简:没有复杂的框架,直接连接浏览器
  • 自愈:AI 可以实时编写缺失的功能
  • 学习:自动沉淀经验,越用越聪明
  • 自由:给 AI 完全的自主权,没有预设约束

这种设计理念不仅让浏览器自动化变得更简单,也让我们看到了 AI 与工具结合的更多可能性。

如果你对浏览器自动化感兴趣,或者想要探索 AI 辅助编程的新方式,不妨去看看这个项目。相信它会给你带来惊喜。

GitHub:https://github.com/browser-use/browser-harness

如果本文对您有帮助,也请帮忙点个 赞👍 哈!❤️

在看你就赞赞我!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源星探 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 项目简介
  • 核心亮点
  • 技术架构
  • 技术栈
  • 快速上手
  • 写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档