首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >如何给 WorkBuddy 有效反馈——"不错"不是反馈

如何给 WorkBuddy 有效反馈——"不错"不是反馈

原创
作者头像
用户12475538
发布2026-05-15 19:24:15
发布2026-05-15 19:24:15
10
举报
文章被收录于专栏:与workbuddy合作与workbuddy合作

如何给 WorkBuddy 有效反馈——"不错"不是反馈

"不错""可以""差不多"——这些话 WorkBuddy 听不懂是因为你自己也没说清楚。有效反馈的三个层次,让你的每句话都让它成长。


大多数反馈是无效的

以下是常见的"反馈",它们对 AI 的成长作用为零:

代码语言:markdown
复制
# 无效反馈
"不错"                        ← 不错在哪?它不知道
"再改一下"                    ← 改什么?它只能猜
"感觉不对"                    ← 什么感觉?什么算"对"?
"不是这样"                    ← 哪样?你心里有,它没有

无效反馈的共同特征:指向结果,不指向原因。 AI 只能根据你的反馈调整行为,但如果你不告诉它"为什么",它就不知道怎么调整。


有效反馈的三个层次

层次一:具体化——把感觉翻译成可操作的点

代码语言:markdown
复制
# ❌ 无效
你:这个方案不太对

# ✅ 层次一:具体化
你:方案的方向对——用缓存加速查询。
   但具体实现有两个问题:
   1. 缓存 key 用了用户 ID,会导致不同数据集共享同一个 key
   2. 过期时间 60 秒太短,这个数据一天才变一次

具体化的关键:先说"对上什么",再说"什么不对"。 如果只说"不对",它会改错方向——可能把'用缓存'这个方向都推翻了。

层次二:给范式——不只修这个,是修这类

代码语言:markdown
复制
# ✅ 层次二:不只针对这次,建一个范式
你:这次缓存 key 的问题,不是只这次加 user_id。
   以后所有缓存 key 都要包含"影响 key 唯一性的所有参数"。

   可以建一条规则:缓存 key = 业务域:实体类型:参数哈希
   比如 order_cache:user_orders:md5(user_id+status+date_range)

   以后写缓存,先确认 key 包含了所有影响查询结果的参数。

范式的价值:你修的不是这个 bug——是修了"所有未来可能犯同类错误"的根因。

层次三:溯因——不只说"对/错",说"为什么对/错"

代码语言:markdown
复制
# ✅ 层次三:让 WorkBuddy 理解你的决策逻辑
你:这次你建议用 Redis Cluster,我拒绝了。不是 Redis 不好。
   是因为这个项目只有单机部署,Redis Cluster 的复杂度(分片/故障转移)
   比它带来的好处多。

   我的选型逻辑是:
   复杂度 < 需求规模。超过需求的方案,再"好"也不是好方案。

   以后建议时,先评估一下方案复杂度和我实际需求的匹配度。

溯因反馈让 WorkBuddy 不只是"记住该做什么"——它开始理解"你为什么会这么选"。 理解了你的决策逻辑,下次它在你没表态之前就能预判。


四种场景下的反馈模板

场景 1:方案对了,细节有问题

代码语言:markdown
复制
[肯定方向] 用装饰器统一处理错误是对的。
[指出问题] 但 @handle_errors 里不要吞掉所有异常——只吞已知的业务异常。
[给范式] 以后异常处理:已知异常 → 返回明确错误码;未知异常 → 抛出让上层决定。

场景 2:方向跑偏,要拉回来

代码语言:markdown
复制
[指出偏差] 我让你做缓存层,你给我做了分布式缓存中间件。这是方向跑偏。
[澄清需求] 当前只需要本地内存缓存(dict-based),不需要分布式。
[防止复发] 下次如果需求里有你判断"可能需要"但没明确要求的复杂度层级——问我,不要自己加。

场景 3:质量在及格线但不够好

代码语言:markdown
复制
[可接受] 代码能跑,逻辑对。
[不够好] 但三个地方的数据校验逻辑是复制的,不是复用的。
[给范式] 重复出现三次的代码 → 抽成函数。同一个逻辑在一个系统里只应在一处定义。

场景 4:你改主意的反馈

代码语言:markdown
复制
[为什么改] 昨天我说用方案 A,今天改方案 B。因为刚发现方案 A 在并发场景下不安全。
[不是它错] 不是你昨天推荐错了——是信息不完整,我当时没给并发约束。
[范式] 以后评估方案时,如果信息不完整可能导致方案在扩展场景下不成立——先问,别直接定。

反馈的量:少即是多

一次对话里,不需要每条回复都给反馈。挑关键的:

代码语言:python
复制
# 值得反馈的(满足任一即反馈)
→ 方案方向性错误
→ 重复了之前的错误
→ 有一个可以推广为"规则"的模式
→ 做得超出预期

# 不值得反馈的(跳过)
→ 格式差异(交给格式化工具)
→ 细节偏差已在下一轮自然修正
→ "感觉不对"但说不清哪不对(先想清楚再反馈)

反馈过多 = 干扰。 每句都对它说"这里改那里改",它不知道该优先级。只在关键节点给反馈,让它自己处理细枝末节。


反馈的本质:你在"教它怎么和你协作"

代码语言:python
复制
# 每一次有效反馈 = 一次协作模型的更新
class CollaborationModel:
    def update(self, feedback):
        if feedback.is_specific:
            # 更新"这个场景怎么做"
            self.patterns[feedback.scene] = feedback.correction
        if feedback.has_rule:
            # 更新"这类场景的通用处理"
            self.rules.add(feedback.rule)
        if feedback.explains_why:
            # 更新"他的决策逻辑"——更深层的更新
            self.decision_model.adjust(feedback.reasoning)

"不错"更新不了任何东西。"方案的方向对,但缓存 key 的粒度太粗——用 user_id 会导致不同查询共享缓存"——这一句更新了三层:这个具体的 bug、以后缓存 key 的规则、你关注"粒度"这个维度的偏好。


从"用"到"养"的分界线

工具型用户和养成型用户的最大区别,就在反馈的质量上。

工具型用户的反馈:"改一下这里"。

养成型用户的反馈:"缓存 key 不只是这次,以后所有缓存都按这个范式——业务域:实体类型:参数哈希。记一下。"

差五个字。差了一个协作者的成长路径。


本文基于与 WorkBuddy 的协作经验撰写。你给 WorkBuddy 的反馈属于哪个层次?评论区自评一下。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 如何给 WorkBuddy 有效反馈——"不错"不是反馈
    • 大多数反馈是无效的
    • 有效反馈的三个层次
      • 层次一:具体化——把感觉翻译成可操作的点
      • 层次二:给范式——不只修这个,是修这类
      • 层次三:溯因——不只说"对/错",说"为什么对/错"
    • 四种场景下的反馈模板
      • 场景 1:方案对了,细节有问题
      • 场景 2:方向跑偏,要拉回来
      • 场景 3:质量在及格线但不够好
      • 场景 4:你改主意的反馈
    • 反馈的量:少即是多
    • 反馈的本质:你在"教它怎么和你协作"
    • 从"用"到"养"的分界线
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档