
这段时间,晚上下班回家,我没有选择刷剧、打游戏,而是做了一件既轻松又有点意思的事:测试 AI 编程的可行性。
我没有“全权托付”给 AI,也不是整晚死磕写代码,而是用了一种非常自然的方式:有点像有人在和你聊天,你只需要时不时回一句,指明一下方向,他就能继续往下做。这就是我和 Codex 的工作模式:我说思路,AI写代码,我再评估与修正。
于是,就有了这个小项目:AutoClick - 一个轻量的自动化点击工具。
AutoClick 是一款基于 Python + OpenCV 开发的图像识别类自动化工具,目标是帮助用户高效完成重复的鼠标点击与测试工作。支持多平台运行(Windows、Linux、macOS),拥有完整的图形界面,已经能独立胜任一些基础的桌面自动化任务。
它能做的事情包括:
项目主页: 👉 https://github.com/KeyleXiao/AutoClick
这个项目的最大亮点,其实不是它实现了什么功能,而是它是 AI 辅助开发的产物,从立项到落地我几乎没有专门“抽时间写代码”,而是利用零碎时间,和 AI 对话、沟通、让它生成代码、再测试、再纠正。
我得出一个有意思的结论:
AI时代,人人都可以是项目经理,但并不是人人都能单兵作战。
AI 很擅长执行,写细节、封装逻辑、补全函数、改UI、加配置……这些它样样精通。但前提是:你要懂你在做什么。
你要能告诉它你需要什么样的识别逻辑、哪个模块该怎么连接、为啥要用 ORB 而不是别的特征算法。否则你得到的只是一个代码堆砌的“黑盒”,根本无法维护。
这就像一个项目里,如果你只能说“我想实现某某功能”,却不懂技术、不懂数据结构、不知道系统之间如何通信,那你就只是一个“提需求的人”。
但在 AI 时代,你如果掌握全局业务逻辑,并能选用熟悉的技术栈,比如 Python,那么你就是一个真正有掌控力的指挥官:
在这个项目里我就明确选择了 Python 作为基石语言。为什么?
因为我熟。熟意味着我能看懂 AI 写出来的东西,能判断逻辑是否合理,能补漏洞,也能重构。而不是每次出错都要重新向 AI 求助,却连错误是啥都说不清。
所以我非常建议:
用你最熟的语言,做你最懂的事,然后让 AI 成为你最强的外援。
如果你对 AI 编程、桌面自动化、图像识别有兴趣,欢迎 Fork 项目试试看: 🔗 AutoClick on GitHub
或者你也可以把自己的业务流程交给 AI 帮忙实现一遍,看看你是否具备“带队写代码”的能力。这个时代,真的已经不同了。