用AI协作写代码，我做了一个自动化测试工具 | AutoClick 项目实录

keyle

发布于 2025-06-07 10:37:12

4730

文章被收录于专栏：礼拜八不工作礼拜八不工作

这段时间，晚上下班回家，我没有选择刷剧、打游戏，而是做了一件既轻松又有点意思的事：测试 AI 编程的可行性。

我没有“全权托付”给 AI，也不是整晚死磕写代码，而是用了一种非常自然的方式：有点像有人在和你聊天，你只需要时不时回一句，指明一下方向，他就能继续往下做。这就是我和 Codex 的工作模式：我说思路，AI写代码，我再评估与修正。

于是，就有了这个小项目：AutoClick - 一个轻量的自动化点击工具。

📌 项目简介：AutoClick 是什么？

AutoClick 是一款基于 Python + OpenCV 开发的图像识别类自动化工具，目标是帮助用户高效完成重复的鼠标点击与测试工作。支持多平台运行（Windows、Linux、macOS），拥有完整的图形界面，已经能独立胜任一些基础的桌面自动化任务。

它能做的事情包括：

✅ 基于 ORB 的图像特征匹配，用于精准识别屏幕区域；
🔁 匹配失败时自动回退到模板匹配，增强容错能力；
🖼️ 截图剪裁创建模板，内置轻量图像编辑界面；
⌨️ 全局热键触发搜索与操作，无需切换界面；
❌ 支持模板删除、替换与列表管理；
🍎 在 macOS 上需在“隐私与安全 → 辅助功能”中授权 Python 控制鼠标键盘。

项目主页： 👉 https://github.com/KeyleXiao/AutoClick

🤖 AI 编程的正确打开方式：你是“总指挥”，AI是“执行兵”

这个项目的最大亮点，其实不是它实现了什么功能，而是它是 AI 辅助开发的产物，从立项到落地我几乎没有专门“抽时间写代码”，而是利用零碎时间，和 AI 对话、沟通、让它生成代码、再测试、再纠正。

我得出一个有意思的结论：

AI时代，人人都可以是项目经理，但并不是人人都能单兵作战。

AI 很擅长执行，写细节、封装逻辑、补全函数、改UI、加配置……这些它样样精通。但前提是：你要懂你在做什么。

你要能告诉它你需要什么样的识别逻辑、哪个模块该怎么连接、为啥要用 ORB 而不是别的特征算法。否则你得到的只是一个代码堆砌的“黑盒”，根本无法维护。

🧭 掌控全局：人类开发者的核心价值

这就像一个项目里，如果你只能说“我想实现某某功能”，却不懂技术、不懂数据结构、不知道系统之间如何通信，那你就只是一个“提需求的人”。

但在 AI 时代，你如果掌握全局业务逻辑，并能选用熟悉的技术栈，比如 Python，那么你就是一个真正有掌控力的指挥官：

你能把复杂的问题拆成具体任务；
你能判断代码的风险点和未来可扩展性；
当 AI 写出有 bug 的代码时，你能快速锁定出错方向；
最重要的是：你知道“这个工具该长成什么样”。

⚠️ 写在最后的提醒：技术栈选错，等于全盘皆输

在这个项目里我就明确选择了 Python 作为基石语言。为什么？

因为我熟。熟意味着我能看懂 AI 写出来的东西，能判断逻辑是否合理，能补漏洞，也能重构。而不是每次出错都要重新向 AI 求助，却连错误是啥都说不清。

所以我非常建议：

用你最熟的语言，做你最懂的事，然后让 AI 成为你最强的外援。

✅ 总结几条经验：

AI 是很棒的执行者，但它需要你指路；
懂业务的人适合当指挥者，但必须有技术支撑；
用你熟悉的技术栈，不要把AI生成的代码变成你的恐惧来源；
最理想的模式是：你主导架构，AI生成细节，你持续校验和迭代。

如果你对 AI 编程、桌面自动化、图像识别有兴趣，欢迎 Fork 项目试试看： 🔗 AutoClick on GitHub

或者你也可以把自己的业务流程交给 AI 帮忙实现一遍，看看你是否具备“带队写代码”的能力。这个时代，真的已经不同了。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2025-06-07，如有侵权请联系 cloudcommunity@tencent.com 删除

工具

本文分享自礼拜八不工作微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度