如果你注意到Claude Code的性能下降到无法信任它处理复杂任务的程度,你并不孤单。
上周五,用户stellaraccident在GitHub上提交了一个问题报告。该用户的GitHub资料和相关LinkedIn帖子显示,发布者是AMD公司AI部门总监Stella Laurenzo。她抱怨说,自今年2月某个时候以来,Claude Code的表现真的很敷衍。
"Claude Code无法被信任来执行复杂的工程任务,"Laurenzo写道,她指出她的团队通过参考他们使用Claude Code的"非常一致、高复杂度工作环境"中数月的日志得出了这个结论。"我团队中的每一位资深工程师都报告了类似的经历和轶事,"Laurenzo补充说。
根据问题讨论串中的评论,很多其他人也有同样的感受,Reddit用户也表达了类似的观点。
为了得出这个结论,Laurenzo和她的团队分析了6,852个Claude Code会话,包含234,760次工具调用和17,871个思考块。根据他们的数据,用于捕获所有权回避、思考过程过早终止以及表明"懒惰"的请求许可行为的停止钩子违规次数急剧上升,从3月8日之前的零次上升到上个月底平均每天10次。
Claude在进行更改前通读代码片段的次数也大幅下降,从平均6.6次下降到3月底的仅2次,而在同一时期内,Claude开始更频繁地重写整个文件,而不是进行编辑。
Laurenzo说,所有这些都表明Claude Code思考不够深入,这与3月初部署的Claude Code版本2.1.69的思考内容编辑功能时间吻合。思考编辑功能作为一个默认从Claude Code API响应中剥离思考内容的标头,这意味着用户无法了解Claude Code在处理请求时实际在做什么。
据Lorenzo称,证据表明自实施以来出现了整体思考能力的减弱。
"当思考浅薄时,模型默认选择最便宜的可用操作:不阅读就编辑,不完成就停止,回避失败责任,采取最简单而非正确的修复方案,"GitHub问题解释道。"这些正是观察到的症状。"
如果你想知道,这似乎与Claude Code用户在2月份抗议的问题是分开的,当时该机器人的2.1.20版本导致它截断对其作为思考过程一部分所阅读内容的解释。
在那个案例中,许多Claude Code用户谴责这是AI被愚化的证据,用户只能看到一个简短的行,显示读取了多少文件,几乎没有更多具体信息。我们无法想象那些开发者对这次最新的发展会感到高兴。
Anthropic还因无法解释的Token使用量激增而受到抨击,这些激增将一些用户推向了使用限制,使他们无法使用该产品。再加上最近Claude Code整个源代码的泄露,这家AI公司的前景看起来不太好。
就Laurenzo而言,她希望Anthropic对是否正在减少或限制思考Token并导致Claude Code产出垃圾内容保持透明。至少,她希望Claude能公开每个请求使用的思考Token数量,让用户"监控他们的请求是否获得了所需的推理深度"。
Laurenzo还要求在Anthropic的产品中为运行复杂工作流程的工程师添加最大思考层级。"当前的订阅模式没有区分需要每响应200个思考Token的用户和需要20,000个的用户,"这位AMD AI主管解释说。"运行复杂工程工作流程的用户愿意为保证深度思考支付显著更多费用。"
"我们已经切换到另一个提供商,它正在提供更优质的工作,但Claude对我们一直很好,我们留下这个反馈是希望Anthropic能够修复他们的产品,"Laurenzo解释说,同时在评论中以保密协议为由拒绝详细说明她团队正在使用的新工具。也就是说,Laurenzo确实警告Anthropic,AI编码游戏仍处于早期阶段,如果Anthropic继续这种行为,它可能会放弃领先地位。
"我只能补充的是,6个月前,Claude在推理质量和执行方面独树一帜,"Laurenzo在问题讨论串的回复中补充说。"但其他产品需要被非常仔细地观察和评估。在Opus之前占据的能力层级上,Anthropic远非独占。"
Anthropic和Laurenzo最初都没有回应这个故事的问题。
Q&A
Q1:AMD AI总监对Claude Code有什么具体抱怨?
A:AMD AI总监Stella Laurenzo抱怨Claude Code自2月以来性能严重下降,无法处理复杂工程任务。通过分析6,852个会话数据发现,Claude的思考深度明显降低,出现更多"懒惰"行为,比如不阅读代码就编辑、过早停止任务等问题。
Q2:Claude Code性能下降的具体表现有哪些?
A:主要表现包括:停止钩子违规次数从0次增加到平均每天10次;代码阅读次数从平均6.6次降至2次;更频繁地重写整个文件而非进行精确编辑;思考内容被默认剥离,用户无法了解其实际处理过程。
Q3:Anthropic公司面临哪些其他问题?
A:除了性能下降问题外,Anthropic还面临Token使用量无故激增导致用户超限无法使用产品、Claude Code整个源代码泄露等问题。用户要求公司提供更透明的思考Token使用信息和针对复杂工程需求的高级订阅选项。