最近技术圈有个很有意思的争论:不少深度用户认为OpenAI的Codex在代码生成的硬核能力上已经超越了Anthropic的Opus,但在大众感知和流行度上,Opus依然占据统治地位。
这不仅是两个模型的较量,更是一场关于“绝对智能”与“用户体验”的经典博弈。
承认Codex更强很难吗?并不难。在处理复杂架构、执行精准指令以及长任务的稳定性上,Codex展现出了惊人的效率。它更像是一个不知疲倦的高级技工,只要你的指令足够清晰,它就能交付出乎意料的高质量代码。
然而,大多数人依然选择Opus。原因很简单:Opus更懂“人”。
这就好比聘请员工。Codex是那种技术顶尖但稍显固执的极客,它能看懂最复杂的蓝图,却偶尔会误解你的口语化需求,甚至在你试图纠正时显得有些“轴”。而Opus则像一位情商极高的产品经理,它未必在每一行代码上都做到极致压缩,但它能精准捕捉你的意图,甚至在你不甚明确时主动补全上下文。
技术圈的极客们往往陷入一种误区,认为只要参数够大、逻辑够强,产品就能赢。但现实是,用户购买的并不是模型跑分,而是“顺畅解决问题的感觉”。
Codex的问题在于它的反馈回路太长。它倾向于一次性给出一个宏大的方案,如果你不满意,修改的成本很高。相比之下,Opus在Claude Code的加持下,提供了一种极其紧凑的交互体验。你可以实时纠偏,可以随时打断,这种掌控感让用户觉得安全。
一个允许你随时插话的伙伴,远比一个关在房间里独自憋大招的天才更有亲和力。
更深层次的原因在于“信任成本”。很多程序员并不是在处理那种需要模型穷尽算力的史诗级难题,他们更需要的是一个能听懂人话、少犯低级错误、能一起探讨思路的副驾驶。当一个模型能像人一样思考、甚至承认自己的不确定性时,这种“拟人化”的体验本身就是一种巨大的生产力。
这就解释了为什么“更聪明”不一定赢。产品的护城河从来不仅仅是技术指标,而是那些被很多人视为“锦上添花”的交互细节。
在这个技术日新月异的时代,用户并没有那么多精力去每周切换工作流。一旦一个工具建立了“足够好”的心智模型,后来者想要颠覆,仅靠提升20%的代码质量是远远不够的。你需要提供一个跨越式的体验,或者彻底改变人机协作的范式。
最好的工具不是那个一次性给出满分答案的神谕,而是那个允许你低成本试错、陪你一起迭代的笨学生。
技术的极限决定了产品的上限,但对人性的理解程度,决定了它能走多远。
x.com/thdxr/status/2021674924360831353