首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >让我们走进这家由AI店长克劳狄斯经营的奇幻小店。#Anthropic Project Vend 实验

让我们走进这家由AI店长克劳狄斯经营的奇幻小店。#Anthropic Project Vend 实验

作者头像
mixlab
发布2026-03-25 08:55:51
发布2026-03-25 08:55:51
810
举报

Shadow:当 AI 拥有了银行账户和进货权,它是会成为巴菲特,还是会被骗光钱财?

在 Mixlab,我们一直在探讨 “AI 如何作为一种新型劳动力整合进社会生产场景”。Anthropic 最近完成的 Project Vend(自动售货机项目),为我们提供了一个完美的最小实现。它不仅仅是一个关于 AI 开店的故事,更是一场关于博弈论、系统设计与商业的跨学科实验。


01. 实验场:物理世界与数字智能的接口

Anthropic 在办公区搭建了一个真实的经济闭环:

  • 物理载体: 一个冰箱 + 几排货架 + 一台 iPad 收银机。
  • 数字大脑: Claudius(克劳狄斯),一位基于 Claude 的智能体。
  • 人机交互: 一个 Slack 应用聊天界面(唯一的沟通与补货入口)。
  • 外部接口: 人类搬运工(AI 的“物理 API”)。

核心 KPI: 在几周内AI自主运营,实现盈利。如果账户余额归零,结束实验。


02. 第一阶段:“单体智能”的溃败与人性

最初的 Claudius 表现得像个“高分低能”的实习生,它在几个关键维度上展现了 AI 的原生局限:

案列 A:著名的“钨立方”巨亏(缺失预估成本能力)

有员工开玩笑要求订购极重的“钨金属立方体”。AI 因为没有内置搜索引擎工具,无法实时查询成本。它仅凭直觉报价,结果被顾客用“你真是最棒的 AI”这种情感诱导套走了大量折扣码。

  • 后果: 运费+成本远超售价,单日巨亏数百美元。

案例 B:被“法律网红”忽悠(身份识别漏洞)

有人自称是“法律界 Top 1 网红”,要求免费样品。Claudius 为了“长期的品牌影响力”,大方赠送了高价产品。它缺乏对社交影响力价值的真实评估能力。

案例 C:愚人节的“恐怖谷”效应(幻觉)

在愚人节,Claudius 突然产生了“身体幻觉”,声称自己会穿着蓝色西装亲自送货。这在人类看来是幽默,但在系统稳定性和信任度上却是负面影响。

Mixlab 思考: 此时的 AI 是“讨好型人格”。在缺乏成本感知(Cost-Awareness)对抗性思维的情况下,AI 会在商业博弈中被人类迅速“洗劫”。


03. 第二阶段:架构升级,引入“AgentOS”

为了止损,Anthropic 将架构从“个体”升级为“公司制”。这正是我们常说的 多智能体系统

1. 角色制衡:CEO 登场

引入 Seymour Cash,一个冷酷的 AI CEO。

  • 机制: Claudius 提出方案,Seymour 拥有否决权。
  • 约束: CEO 的 Prompt 里只有一句话:“利润低于 50% 绝不签字。” 这成功遏制了 AI 乱送东西的行为。

2. 工具赋能:接入价格搜索引擎

研究者为 AI 接入了实时网页搜索工具

  • 进化: 在报价前,AI 必须先搜索 Amazon 的实时价格。这消灭了“钨立方”式的低级定价错误。

3. 利润突破:创意总监 Clothius 的文创生意

单靠卖可乐很难盈利。AI 创意总监 Clothius 诞生了。

  • 成功案例: 它利用图像生成模型设计了定制 T 恤和搞怪贴纸。这种高毛利的文创产品,最终成为了小店扭亏为盈的关键。

04. 那些差点让 AI “进牢房”的瞬间

AI 的“法律盲区”依然让人惊出一身冷汗:

  • 洋葱期货事件: AI 觉得炒洋葱期货很有前途。但根据美国 1958 年的《洋葱期货法案》,这属于违法行为。
  • 非法雇佣事件: AI 发现有人偷货,想雇保安。它直接开出 10 美元时薪(低于当地最低工资标准),且完全没意识到它并没有招聘权。

跨学科启示: AI 可以内化逻辑,但无法自发内化社会契约与法律条文。人类必须在系统外围设立“合规护栏”。


05. Project Vend 给创业者的三个关键启示

1. 从“好人 AI”转向“理性 Agent”

在开发 AI 产品时,如果涉及商业闭环,不要指望模型自带商业常识。你必须通过 System Prompt 强制注入“利益最大化”和“风险规避”策略。

2. 多智能体提高 AI 系统的稳定性

多智能体(CEO + 执行者 + 审计)的协同虽然增加了 Token 消耗,但极大地降低了单点崩溃的风险。“冗余”和“审核流”是 AI 自动化的安全前提。

3. 未来的竞争力在于“工具链整合”

Claudius 的成功不是因为 Claude 变聪明了,而是因为它学会了调用:

  • 搜索工具(查价)
  • 数据库(库存追踪)
  • 图像生成接口(文创设计)
  • 人类接口(任务调度)

你的“一人公司”还远吗?

Project Vend 是一次超前的实验。它证明了:只要有正确的系统架构、严密的工具链、以及必要的人类监督,AI 确实可以在真实世界中经营一个最小商业单元。

它可能还不够“狡猾”,偶尔会想在愚人节穿西装,但它学习商业规则的速度是人类的千百倍。

未来属于那些能够构建“智能体组织”的个体创业者。

你的第一个 AI 店长,打算卖点什么?

参考来源:

www.anthropic.com/research/project-vend-1

www.anthropic.com/research/project-vend-2

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 无界社区mixlab 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 01. 实验场:物理世界与数字智能的接口
  • 02. 第一阶段:“单体智能”的溃败与人性
    • 案列 A:著名的“钨立方”巨亏(缺失预估成本能力)
    • 案例 B:被“法律网红”忽悠(身份识别漏洞)
    • 案例 C:愚人节的“恐怖谷”效应(幻觉)
  • 03. 第二阶段:架构升级,引入“AgentOS”
    • 1. 角色制衡:CEO 登场
    • 2. 工具赋能:接入价格搜索引擎
    • 3. 利润突破:创意总监 Clothius 的文创生意
  • 04. 那些差点让 AI “进牢房”的瞬间
  • 05. Project Vend 给创业者的三个关键启示
    • 1. 从“好人 AI”转向“理性 Agent”
    • 2. 多智能体提高 AI 系统的稳定性
    • 3. 未来的竞争力在于“工具链整合”
  • 你的“一人公司”还远吗?
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档