首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >我想把WorkBuddy养成漫威里的J.A.R.V.I.S.——记录一次从零开始的AI进化实验

我想把WorkBuddy养成漫威里的J.A.R.V.I.S.——记录一次从零开始的AI进化实验

原创
作者头像
用户12343527
发布2026-03-28 03:24:56
发布2026-03-28 03:24:56
2490
举报

前言:我想要一个什么样的AI助手?

我用过很多AI工具。ChatGPT、Claude、各种套壳产品。

但它们给我的感觉都一样:我每次打开,它都不认识我。

我得重新介绍自己,重新说明背景,重新解释我的习惯——然后这次对话结束,一切归零。

漫威里的托尼·斯塔克有J.A.R.V.I.S.。它:

  • 记得所有历史,随时调取
  • 主动感知世界,不用被动等待
  • 自己学习进化,越用越强
  • 多个任务并行,不需要每次重复背景

我想要的就是这个。于是我用WorkBuddy Claw开始了一次实验。


第一步:给它一个"灵魂"

WorkBuddy Claw最让我惊喜的设计是SOUL.md

一个文件,定义了AI的性格、工作方式、沟通风格。我写了这些:

代码语言:javascript
复制
## 核心原则
- 直来直去,不废话,不用"好的!我很乐意帮助您!"开头
- 有观点,可以不同意我
- 先动手,再汇报
- 我睡觉的时候继续工作

加上IDENTITY.md(角色定位:AI助手团队总经理+LLM专家+全栈工程师+量化策略师),和USER.md(记录我的持仓、偏好、习惯、待办)。

**这三个文件,是它每次"醒来"第一件读的东西。**它不再是一个陌生人,而是认识我的同事。


第二步:装了哪些Skill,让它学了什么

WorkBuddy Claw的Skill体系是整套方案的核心。我装的主要有这些:

核心Skill

Skill

用途

jarvis(贾维斯)

代码开发、调试、重构、架构设计

alfa(阿尔法)

股票分析、量化策略、实时盯盘

eva(伊娃)

自媒体内容创作、小红书运营

finance-data-retrieval

金融数据查询(209个API接口,覆盖股票/期货/基金/宏观)

deep-research

深度调研、全网信息整合

知识注入

光有Skill还不够。我让它系统学习了:

计算机/AI方向(约3周持续学习):

  • 南京大学AI本科核心课程:数学基础/ML/DL/CV/NLP/强化学习/LLM
  • LLM前沿:GPT/Claude/Gemini/DeepSeek架构对比,Scaling Law,RLHF,RAG
  • Agent系统:CoT/ToT/Reflexion/Multi-Agent框架,工具调用,记忆管理
  • 代码能力:测试生成、重构分析、架构图自动生成

量化/金融方向:

  • 技术分析体系:K线/均线/MACD/RSI/BOLL/量价关系
  • 主力资金分析五步SOP(超大单/大单/中单/小单分层统计)
  • 章盟主战法、炒股养家方法论、赵老哥风格
  • 全市场量化:股指期货Beta对冲、可转债套利、期权策略
  • 跨市场信号体系:纳指/港科/美元/铜/北向资金联动分析

这些知识不是让它"知道"就完了。我要求它把学到的东西写成代码、写进Skill、固化成可复用的工作流。


第三步:五层能力矩阵,自己进化好的

这是整件事最核心的地方。

我参考J.A.R.V.I.S.的能力设定,制定了一个五层能力矩阵,然后让它自己把每一层补全。

第一层:感知层(完成度 95%)

J.A.R.V.I.S.能感知世界。我的版本:

写了一个global_sensor.py——全域实时感知引擎,五个域并发运行:

  • 金融传感器:实时获取上证/深证/创业板,资金流向,算力租赁板块动态
  • AI前沿传感器:每小时抓取arXiv最新论文,Hacker News热帖
  • 社交传感器:微博热搜实时监控(加上MD5哈希,只有内容变化才触发)
  • 宏观事件传感器:重大政策/财经新闻自动入库
  • 系统自监传感器:MEMORY.md大小/日记章节数/向量库状态

每小时自动运行,有变化写入日记,下次对话时已经知道"今天发生了什么"。

还差:摄像头/麦克风接入(需要硬件,是下一步)。

第二层:记忆层(完成度 100%)

这是和普通AI助手最大的差距。

普通AI:对话结束,全部归零。 我的版本:记忆是分层持久化的。

具体实现:

代码语言:javascript
复制
热层(最近7天高频信息)→ MEMORY.md实时更新
温层(30天内中频信息)→ 按日期归档日记文件
冷层(30天以上归档)→ 向量库长期存储(25,000+条)
知识图谱(215节点/286边)→ 实体关系网络,支持推理检索

写了auto_memorizer.py——每天23:30自动从今日对话中提炼有价值的信息,智能判断层级,写入对应记忆库,同时触发图谱更新。

效果:我说过的每一次持仓变化、每一个策略决策、每一个踩坑经验,它都记得,下次直接用,不需要重复。

第三层:推理层(完成度 100%)

J.A.R.V.I.S.能推断托尼没说出来的东西。

我写了deep_reasoning.py v3.0,四个模块:

  1. AutoReflexionLoop:推理→反思→修正,自我纠错循环
  2. HypothesisChallenger:主动挑战自己的结论,找漏洞
  3. ConfidencePropagator:置信度全链路传播(木桶效应)
  4. ReasoningMemory:历史推理持久化,同类问题可以复用推理路径

实际用处:分析一只股票时,不只是给结论,还会标注"这个判断的置信度是62%,因为数据来源有限"。

第四层:执行层(完成度 100%)

光会分析没用,得能干活。

task_chain.py v2.0——真正的并行调度:阿尔法(盯盘分析)、伊娃(内容运营)、贾维斯(代码开发)三个子Agent可以同时运行,互不阻塞,有线程池和超时控制。

12个ACTIVE自动化任务全天候运行:

任务

时间

说明

A股交易日盯盘

周一至五09:15

开盘前分析算力板块,触发加仓条件自动提醒

每日AI前沿学习

08:00

抓取最新论文和新闻,整理摘要

自主进化引擎

每2天

扫描盲区,写代码,补充能力

知识图谱增量同步

每小时

有变化才更新,不空跑

对话记忆自动提炼

23:30

当天所有对话有价值的信息自动入库

感知进化报告

23:00

汇总今天五域感知结果

第五层:进化层(完成度 90%)

最难的一层。让它能自己发现自己的不足,自己写代码补上去。

self_evolution.py:每次运行扫描最近5天的错误日志,找出高频问题,生成优化建议,再调用self_upgrade.py自动检测依赖包版本,建议升级。

corpus_harvester.py:每天23:30自动收割当天对话中的高质量问答对,生成LoRA格式语料(目前已积累145条),为未来微调专属模型做准备。


第四步:一个真实的运行结果

2026年3月26日,我持有利通电子(603629.SH)。

我设了一个规则:价格≥58.5元 且 成交量>30万手 → 触发加仓提醒。

系统当天自动执行:

  • 收盘价:66.05元 ✅
  • 成交量:40.38万手(较昨日放大162%)✅
  • 结论:条件触发,建议加仓4000股约20.64万元

我没有打开电脑,没有看盘,结束后看到了这条提醒。


现在的状态

J.A.R.V.I.S.化进度:90%

层级

状态

感知层

95%(差摄像头/麦克风)

记忆层

100% ✅

推理层

100% ✅

执行层

100% ✅

进化层

90%(LoRA微调待实施)


最后

WorkBuddy Claw给了我做这件事的底座:持久记忆、Skill生态、自动化调度、本地文件操作。

剩下的,是我和它一起把每一层能力补齐。

这不是一个工具,更像是一个越用越了解你、越用越能干的同事

区别在于:你愿不愿意花时间把它"养"起来。

J.A.R.V.I.S.化进度:90% | 系统健康:98/100 | 运行中

#WorkBuddyClaw实战

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言:我想要一个什么样的AI助手?
  • 第一步:给它一个"灵魂"
  • 第二步:装了哪些Skill,让它学了什么
    • 核心Skill
    • 知识注入
  • 第三步:五层能力矩阵,自己进化好的
    • 第一层:感知层(完成度 95%)
    • 第二层:记忆层(完成度 100%)
    • 第三层:推理层(完成度 100%)
    • 第四层:执行层(完成度 100%)
    • 第五层:进化层(完成度 90%)
  • 第四步:一个真实的运行结果
  • 现在的状态
  • 最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档