Shadow:当 AI 拥有了银行账户和进货权,它是会成为巴菲特,还是会被骗光钱财?
在 Mixlab,我们一直在探讨 “AI 如何作为一种新型劳动力整合进社会生产场景”。Anthropic 最近完成的 Project Vend(自动售货机项目),为我们提供了一个完美的最小实现。它不仅仅是一个关于 AI 开店的故事,更是一场关于博弈论、系统设计与商业的跨学科实验。


Anthropic 在办公区搭建了一个真实的经济闭环:
核心 KPI: 在几周内AI自主运营,实现盈利。如果账户余额归零,结束实验。

最初的 Claudius 表现得像个“高分低能”的实习生,它在几个关键维度上展现了 AI 的原生局限:
有员工开玩笑要求订购极重的“钨金属立方体”。AI 因为没有内置搜索引擎工具,无法实时查询成本。它仅凭直觉报价,结果被顾客用“你真是最棒的 AI”这种情感诱导套走了大量折扣码。
有人自称是“法律界 Top 1 网红”,要求免费样品。Claudius 为了“长期的品牌影响力”,大方赠送了高价产品。它缺乏对社交影响力价值的真实评估能力。
在愚人节,Claudius 突然产生了“身体幻觉”,声称自己会穿着蓝色西装亲自送货。这在人类看来是幽默,但在系统稳定性和信任度上却是负面影响。
Mixlab 思考: 此时的 AI 是“讨好型人格”。在缺乏成本感知(Cost-Awareness)和对抗性思维的情况下,AI 会在商业博弈中被人类迅速“洗劫”。

为了止损,Anthropic 将架构从“个体”升级为“公司制”。这正是我们常说的 多智能体系统:
引入 Seymour Cash,一个冷酷的 AI CEO。
研究者为 AI 接入了实时网页搜索工具。
单靠卖可乐很难盈利。AI 创意总监 Clothius 诞生了。



AI 的“法律盲区”依然让人惊出一身冷汗:

跨学科启示: AI 可以内化逻辑,但无法自发内化社会契约与法律条文。人类必须在系统外围设立“合规护栏”。

在开发 AI 产品时,如果涉及商业闭环,不要指望模型自带商业常识。你必须通过 System Prompt 强制注入“利益最大化”和“风险规避”策略。

多智能体(CEO + 执行者 + 审计)的协同虽然增加了 Token 消耗,但极大地降低了单点崩溃的风险。“冗余”和“审核流”是 AI 自动化的安全前提。

Claudius 的成功不是因为 Claude 变聪明了,而是因为它学会了调用:

Project Vend 是一次超前的实验。它证明了:只要有正确的系统架构、严密的工具链、以及必要的人类监督,AI 确实可以在真实世界中经营一个最小商业单元。
它可能还不够“狡猾”,偶尔会想在愚人节穿西装,但它学习商业规则的速度是人类的千百倍。
未来属于那些能够构建“智能体组织”的个体创业者。
你的第一个 AI 店长,打算卖点什么?
参考来源:
www.anthropic.com/research/project-vend-1
www.anthropic.com/research/project-vend-2