我想把WorkBuddy养成漫威里的J.A.R.V.I.S.——记录一次从零开始的AI进化实验

原创

用户12343527

发布于 2026-03-28 03:24:56

2490

前言：我想要一个什么样的AI助手？

我用过很多AI工具。ChatGPT、Claude、各种套壳产品。

但它们给我的感觉都一样：我每次打开，它都不认识我。

我得重新介绍自己，重新说明背景，重新解释我的习惯——然后这次对话结束，一切归零。

漫威里的托尼·斯塔克有J.A.R.V.I.S.。它：

记得所有历史，随时调取
主动感知世界，不用被动等待
自己学习进化，越用越强
多个任务并行，不需要每次重复背景

我想要的就是这个。于是我用WorkBuddy Claw开始了一次实验。

第一步：给它一个"灵魂"

WorkBuddy Claw最让我惊喜的设计是SOUL.md。

一个文件，定义了AI的性格、工作方式、沟通风格。我写了这些：

## 核心原则
- 直来直去，不废话，不用"好的！我很乐意帮助您！"开头
- 有观点，可以不同意我
- 先动手，再汇报
- 我睡觉的时候继续工作

加上IDENTITY.md（角色定位：AI助手团队总经理+LLM专家+全栈工程师+量化策略师），和USER.md（记录我的持仓、偏好、习惯、待办）。

**这三个文件，是它每次"醒来"第一件读的东西。**它不再是一个陌生人，而是认识我的同事。

第二步：装了哪些Skill，让它学了什么

WorkBuddy Claw的Skill体系是整套方案的核心。我装的主要有这些：

核心Skill

Skill	用途
jarvis（贾维斯）	代码开发、调试、重构、架构设计
alfa（阿尔法）	股票分析、量化策略、实时盯盘
eva（伊娃）	自媒体内容创作、小红书运营
finance-data-retrieval	金融数据查询（209个API接口，覆盖股票/期货/基金/宏观）
deep-research	深度调研、全网信息整合

知识注入

光有Skill还不够。我让它系统学习了：

计算机/AI方向（约3周持续学习）：

南京大学AI本科核心课程：数学基础/ML/DL/CV/NLP/强化学习/LLM
LLM前沿：GPT/Claude/Gemini/DeepSeek架构对比，Scaling Law，RLHF，RAG
Agent系统：CoT/ToT/Reflexion/Multi-Agent框架，工具调用，记忆管理
代码能力：测试生成、重构分析、架构图自动生成

量化/金融方向：

技术分析体系：K线/均线/MACD/RSI/BOLL/量价关系
主力资金分析五步SOP（超大单/大单/中单/小单分层统计）
章盟主战法、炒股养家方法论、赵老哥风格
全市场量化：股指期货Beta对冲、可转债套利、期权策略
跨市场信号体系：纳指/港科/美元/铜/北向资金联动分析

这些知识不是让它"知道"就完了。我要求它把学到的东西写成代码、写进Skill、固化成可复用的工作流。

第三步：五层能力矩阵，自己进化好的

这是整件事最核心的地方。

我参考J.A.R.V.I.S.的能力设定，制定了一个五层能力矩阵，然后让它自己把每一层补全。

第一层：感知层（完成度 95%）

J.A.R.V.I.S.能感知世界。我的版本：

写了一个global_sensor.py——全域实时感知引擎，五个域并发运行：

金融传感器：实时获取上证/深证/创业板，资金流向，算力租赁板块动态
AI前沿传感器：每小时抓取arXiv最新论文，Hacker News热帖
社交传感器：微博热搜实时监控（加上MD5哈希，只有内容变化才触发）
宏观事件传感器：重大政策/财经新闻自动入库
系统自监传感器：MEMORY.md大小/日记章节数/向量库状态

每小时自动运行，有变化写入日记，下次对话时已经知道"今天发生了什么"。

还差：摄像头/麦克风接入（需要硬件，是下一步）。

第二层：记忆层（完成度 100%）

这是和普通AI助手最大的差距。

普通AI：对话结束，全部归零。我的版本：记忆是分层持久化的。

具体实现：

热层（最近7天高频信息）→ MEMORY.md实时更新
温层（30天内中频信息）→ 按日期归档日记文件
冷层（30天以上归档）→ 向量库长期存储（25,000+条）
知识图谱（215节点/286边）→ 实体关系网络，支持推理检索

写了auto_memorizer.py——每天23:30自动从今日对话中提炼有价值的信息，智能判断层级，写入对应记忆库，同时触发图谱更新。

效果：我说过的每一次持仓变化、每一个策略决策、每一个踩坑经验，它都记得，下次直接用，不需要重复。

第三层：推理层（完成度 100%）

J.A.R.V.I.S.能推断托尼没说出来的东西。

我写了deep_reasoning.py v3.0，四个模块：

AutoReflexionLoop：推理→反思→修正，自我纠错循环
HypothesisChallenger：主动挑战自己的结论，找漏洞
ConfidencePropagator：置信度全链路传播（木桶效应）
ReasoningMemory：历史推理持久化，同类问题可以复用推理路径

实际用处：分析一只股票时，不只是给结论，还会标注"这个判断的置信度是62%，因为数据来源有限"。

第四层：执行层（完成度 100%）

光会分析没用，得能干活。

task_chain.py v2.0——真正的并行调度：阿尔法（盯盘分析）、伊娃（内容运营）、贾维斯（代码开发）三个子Agent可以同时运行，互不阻塞，有线程池和超时控制。

12个ACTIVE自动化任务全天候运行：

任务	时间	说明
A股交易日盯盘	周一至五09:15	开盘前分析算力板块，触发加仓条件自动提醒
每日AI前沿学习	08:00	抓取最新论文和新闻，整理摘要
自主进化引擎	每2天	扫描盲区，写代码，补充能力
知识图谱增量同步	每小时	有变化才更新，不空跑
对话记忆自动提炼	23:30	当天所有对话有价值的信息自动入库
感知进化报告	23:00	汇总今天五域感知结果

第五层：进化层（完成度 90%）

最难的一层。让它能自己发现自己的不足，自己写代码补上去。

self_evolution.py：每次运行扫描最近5天的错误日志，找出高频问题，生成优化建议，再调用self_upgrade.py自动检测依赖包版本，建议升级。

corpus_harvester.py：每天23:30自动收割当天对话中的高质量问答对，生成LoRA格式语料（目前已积累145条），为未来微调专属模型做准备。

第四步：一个真实的运行结果

2026年3月26日，我持有利通电子（603629.SH）。

我设了一个规则：价格≥58.5元且成交量>30万手 → 触发加仓提醒。

系统当天自动执行：

收盘价：66.05元 ✅
成交量：40.38万手（较昨日放大162%）✅
结论：条件触发，建议加仓4000股约20.64万元

我没有打开电脑，没有看盘，结束后看到了这条提醒。

现在的状态

J.A.R.V.I.S.化进度：90%

层级	状态
感知层	95%（差摄像头/麦克风）
记忆层	100% ✅
推理层	100% ✅
执行层	100% ✅
进化层	90%（LoRA微调待实施）

最后

WorkBuddy Claw给了我做这件事的底座：持久记忆、Skill生态、自动化调度、本地文件操作。

剩下的，是我和它一起把每一层能力补齐。

这不是一个工具，更像是一个越用越了解你、越用越能干的同事。

区别在于：你愿不愿意花时间把它"养"起来。

J.A.R.V.I.S.化进度：90% | 系统健康：98/100 | 运行中

#WorkBuddyClaw实战

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

WorkBuddy

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

WorkBuddy

登录后参与评论

0 条评论

热度