如何给 WorkBuddy 有效反馈——"不错"不是反馈

原创

狗有狗的烦恼

发布于 2026-05-15 19:24:15

2710

文章被收录于专栏：与workbuddy合作与workbuddy合作

如何给 WorkBuddy 有效反馈——"不错"不是反馈

"不错""可以""差不多"——这些话 WorkBuddy 听不懂是因为你自己也没说清楚。有效反馈的三个层次，让你的每句话都让它成长。

大多数反馈是无效的

以下是常见的"反馈"，它们对 AI 的成长作用为零：

# 无效反馈
"不错"                        ← 不错在哪？它不知道
"再改一下"                    ← 改什么？它只能猜
"感觉不对"                    ← 什么感觉？什么算"对"？
"不是这样"                    ← 哪样？你心里有，它没有

无效反馈的共同特征：指向结果，不指向原因。 AI 只能根据你的反馈调整行为，但如果你不告诉它"为什么"，它就不知道怎么调整。

有效反馈的三个层次

层次一：具体化——把感觉翻译成可操作的点

# ❌ 无效
你：这个方案不太对

# ✅ 层次一：具体化
你：方案的方向对——用缓存加速查询。
   但具体实现有两个问题：
   1. 缓存 key 用了用户 ID，会导致不同数据集共享同一个 key
   2. 过期时间 60 秒太短，这个数据一天才变一次

具体化的关键：先说"对上什么"，再说"什么不对"。 如果只说"不对"，它会改错方向——可能把'用缓存'这个方向都推翻了。

层次二：给范式——不只修这个，是修这类

# ✅ 层次二：不只针对这次，建一个范式
你：这次缓存 key 的问题，不是只这次加 user_id。
   以后所有缓存 key 都要包含"影响 key 唯一性的所有参数"。

   可以建一条规则：缓存 key = 业务域:实体类型:参数哈希
   比如 order_cache:user_orders:md5(user_id+status+date_range)

   以后写缓存，先确认 key 包含了所有影响查询结果的参数。

范式的价值：你修的不是这个 bug——是修了"所有未来可能犯同类错误"的根因。

层次三：溯因——不只说"对/错"，说"为什么对/错"

# ✅ 层次三：让 WorkBuddy 理解你的决策逻辑
你：这次你建议用 Redis Cluster，我拒绝了。不是 Redis 不好。
   是因为这个项目只有单机部署，Redis Cluster 的复杂度（分片/故障转移）
   比它带来的好处多。

   我的选型逻辑是：
   复杂度 < 需求规模。超过需求的方案，再"好"也不是好方案。

   以后建议时，先评估一下方案复杂度和我实际需求的匹配度。

溯因反馈让 WorkBuddy 不只是"记住该做什么"——它开始理解"你为什么会这么选"。 理解了你的决策逻辑，下次它在你没表态之前就能预判。

四种场景下的反馈模板

场景 1：方案对了，细节有问题

[肯定方向] 用装饰器统一处理错误是对的。
[指出问题] 但 @handle_errors 里不要吞掉所有异常——只吞已知的业务异常。
[给范式] 以后异常处理：已知异常 → 返回明确错误码；未知异常 → 抛出让上层决定。

场景 2：方向跑偏，要拉回来

[指出偏差] 我让你做缓存层，你给我做了分布式缓存中间件。这是方向跑偏。
[澄清需求] 当前只需要本地内存缓存（dict-based），不需要分布式。
[防止复发] 下次如果需求里有你判断"可能需要"但没明确要求的复杂度层级——问我，不要自己加。

场景 3：质量在及格线但不够好

[可接受] 代码能跑，逻辑对。
[不够好] 但三个地方的数据校验逻辑是复制的，不是复用的。
[给范式] 重复出现三次的代码 → 抽成函数。同一个逻辑在一个系统里只应在一处定义。

场景 4：你改主意的反馈

[为什么改] 昨天我说用方案 A，今天改方案 B。因为刚发现方案 A 在并发场景下不安全。
[不是它错] 不是你昨天推荐错了——是信息不完整，我当时没给并发约束。
[范式] 以后评估方案时，如果信息不完整可能导致方案在扩展场景下不成立——先问，别直接定。

反馈的量：少即是多

一次对话里，不需要每条回复都给反馈。挑关键的：

# 值得反馈的（满足任一即反馈）
→ 方案方向性错误
→ 重复了之前的错误
→ 有一个可以推广为"规则"的模式
→ 做得超出预期

# 不值得反馈的（跳过）
→ 格式差异（交给格式化工具）
→ 细节偏差已在下一轮自然修正
→ "感觉不对"但说不清哪不对（先想清楚再反馈）

反馈过多 = 干扰。 每句都对它说"这里改那里改"，它不知道该优先级。只在关键节点给反馈，让它自己处理细枝末节。

反馈的本质：你在"教它怎么和你协作"

# 每一次有效反馈 = 一次协作模型的更新
class CollaborationModel:
    def update(self, feedback):
        if feedback.is_specific:
            # 更新"这个场景怎么做"
            self.patterns[feedback.scene] = feedback.correction
        if feedback.has_rule:
            # 更新"这类场景的通用处理"
            self.rules.add(feedback.rule)
        if feedback.explains_why:
            # 更新"他的决策逻辑"——更深层的更新
            self.decision_model.adjust(feedback.reasoning)

"不错"更新不了任何东西。"方案的方向对，但缓存 key 的粒度太粗——用 user_id 会导致不同查询共享缓存"——这一句更新了三层：这个具体的 bug、以后缓存 key 的规则、你关注"粒度"这个维度的偏好。

从"用"到"养"的分界线

工具型用户和养成型用户的最大区别，就在反馈的质量上。

工具型用户的反馈："改一下这里"。

养成型用户的反馈："缓存 key 不只是这次，以后所有缓存都按这个范式——业务域:实体类型:参数哈希。记一下。"

差五个字。差了一个协作者的成长路径。

本文基于与 WorkBuddy 的协作经验撰写。你给 WorkBuddy 的反馈属于哪个层次？评论区自评一下。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

WorkBuddy

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

WorkBuddy

登录后参与评论

0 条评论

热度

如何给 WorkBuddy 有效反馈——"不错"不是反馈

如何给 WorkBuddy 有效反馈——"不错"不是反馈

如何给 WorkBuddy 有效反馈——"不错"不是反馈

大多数反馈是无效的

有效反馈的三个层次

层次一：具体化——把感觉翻译成可操作的点

层次二：给范式——不只修这个，是修这类

层次三：溯因——不只说"对/错"，说"为什么对/错"

四种场景下的反馈模板

场景 1：方案对了，细节有问题

场景 2：方向跑偏，要拉回来

场景 3：质量在及格线但不够好

场景 4：你改主意的反馈

反馈的量：少即是多

反馈的本质：你在"教它怎么和你协作"

从"用"到"养"的分界线

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐