
全文概览
当每个人都在下载AI工具、搭建个人智能体、绕过IT部门直接提升工作效率时,企业是正在迎来一场生产力革命,还是在加速制造下一代的"智能孤岛"?
这正是theCUBE Research首席分析师Dave Vellante与George Gilbert在本文中提出的核心追问。他们指出,个人智能体正以"自下而上"的方式点燃企业AI的导火索——如同当年PC时代的电子表格和文字处理软件,个人正在用智能体、开放工具和可重复技能重新掌控工作。但关键区别在于:智能体不仅能创建文档,它们还能采取行动——触达数据、调用工具、启动应用。如果每个部门、每个供应商都建立自己的智能孤岛,企业将重蹈数十年来软件孤岛的覆辙,且速度更快、运营风险更高。
在此背景下,Snowflake和Databricks正从数据平台向AI栈的更高层——智能系统(System of Intelligence)——迈进。本文系统性地拆解了新兴AI软件栈的五层架构、九级数据成熟度模型,以及智能体自主性如何被数据基础的丰富程度所限制。对于关注企业AI落地的技术从业者和行业观察者而言,这是一幅从"与数据对话"到"让智能体安全行动"的完整路线图。
阅读收获
👉 划线高亮 观点批注

深度分析:Dave Vellante 与 George Gilbert
人工智能浪潮正呈现出与个人电脑(PC)时代相似的特征,但两者之间存在显著差异。
首要相似点在于个人生产力。正如当年的超级用户利用电子表格、文字处理软件、演示图形和 PC 掌控工作一样,个人如今正通过智能体(Agents)、开放工具和可重复技能来掌控自己的工作。AI 的早期需求来自高层——由首席执行官和董事会推动 AI 进入企业,但目前采用的第一阶段正日益呈现“自下而上”的趋势。人们正在下载工具,将其接入自己的工作流,并在无需等待正式企业转型计划的情况下,寻找提高效率的方法。
然而,这一浪潮与 PC 时代存在一个重大区别。智能体不仅能创建文档、电子表格和仪表板,它们还能采取行动。它们可以触达数据、调用工具、启动应用程序,并随着时间的推移执行工作。因此,如果每个人、每个部门和每个供应商都建立自己的“智能孤岛”,企业将重蹈软件业数十年来深受其害的“孤岛问题”覆辙——而且速度更快,运营风险更高。这可能是旅程中必要的一步,但绝不能是最终状态。
我们在本次深度分析中的前提是:个人智能体将点燃导火索,但可持续的企业价值将归属于那些将业务知识组织成真正的智能系统(System of Intelligence, SoI) 的平台。交互系统(System of Engagement) 成为新的前端(下一阶段的竞争将从模型层转移到编排层,注意:这里的编排不是多智能体,而是跨数据源的连接和智能放大)——人们在此与智能体交互并完成工作。智能系统则成为后端——这一层级组织了企业数据、信任、上下文、行动和业务逻辑,从而使信息变得可供人类阅读、可供智能体阅读,并最终可由智能体执行。
这就是 Snowflake Inc. 和 Databricks Inc. 此刻如此重要的原因。在下周的 Snowflake Summit 和两周后的 Databricks Data + AI Summit 之前,我们认为应在更宏大的行业转型背景下看待这两家公司。正如我们大约一年前所言,两家公司都已经跨越了卢比孔河[1]。它们不再仅仅是服务于分析工作负载的数据平台。它们正向企业知识、规则、上下文以及最终业务逻辑成为智能行动基质的层级迈进。
它们并不孤单。应用程序供应商、超大规模云服务商和前沿模型公司都在追求这种控制点的某种版本,因为谁能帮助组织最好地建模业务,谁就能塑造智能体推理、决策和行动的方式。前沿模型至关重要——它们是这个时代的引擎。但拥有模型并不等同于拥有企业运营上下文。智能系统是智能体生存的世界;而模型是在该世界中进行推理的引擎。
在我们看来,这种转型将同时在两个方向上发生。自下而上,个人将构建能够立即提高生产力的个人智能体和技能;自上而下,领导层必须将这种能量引导至 AI 原生架构中,使这些技能成为连接到共享本体(Shared Ontology)的受控资产,而不是产生新一代互不连通的工具。首席信息官、首席 AI 官和数据领导者的工作不是减缓这一进程,而是确保自下而上的努力接入到一个能防止形成新孤岛的架构中。
在本次深度分析中,我们将深入探讨新兴的 AI 软件栈,并剖析企业如何从个人生产力转向组织生产力。我们将审视 Snowflake 和 Databricks 如何突破其现有的数据平台赛道,它们的举措与应用程序供应商和模型制造商相比如何,以及为什么未来十年的企业 AI 将由争夺将业务知识、规则、行动和反馈组织成共享智能系统的竞争所塑造。
下图展示了新兴的 AI 软件栈,并为我们描述行业走向提供了一种方式。该模型建立在 Geoffrey Moore 的概念之上,展示了五个主要部分:左侧的交互系统、顶部的代理系统(System of Agency)、中间的智能系统,以及下方的数据平台和记录系统。核心理念是,新的软件栈不会一次性取代所有先前的企业系统,而是围绕智能、上下文和行动对它们进行重组。
从左侧的紫色方框开始:交互系统。这并非社交媒体意义上的交互,而是新的前端——人类和智能体与数据、决策和行动进行交互的地方。恰当的类比是 Windows、浏览器或智能手机。每一个前端都推动了新的后端:Windows 最终推动了客户机-服务器计算;浏览器推动了可扩展的 Web 后端;移动和 Web 推动了云。个人智能体和智能接口现在正产生同样的压力。为了使新前端有用,企业需要一个新的后端,能够以人类和智能体可用的方式组织知识、规则、上下文和业务状态。

该后端即智能系统——上图中中间的绿色层。这是最艰巨的工作所在。企业花费了数十年时间构建运营数据和分析数据的孤岛。今天,人类通过部门、职能团队、矩阵组织、会议和部落知识来连接这些孤岛。智能体需要更明确的东西。它们需要一个协调一致的业务模型,以便能够理解状态、应用规则、在上下文中进行推理并自信地采取行动。这意味着业务逻辑必须像过去几十年数据成为资产一样,成为一种资产。
顶层是代理系统。这是智能体感知、推理、决策、行动和学习的地方。但这些智能体的效用取决于它们能看到的状态以及它们被允许采取的行动。它们通过智能系统理解业务,并通过它将决策付诸实践。这就是为什么智能系统是该软件栈中高价值层级的原因。它是智能体生存的世界。
前一张幻灯片提供了概念模型。下图开始将公司名称放入架构中,这使得行业竞争界限变得更加清晰。重点不是假装这些方框是固定的,或者任何供应商只能整齐地归入一个位置,而是展示压力正在哪里积聚。Snowflake 和 Databricks 起步于数据平台,但它们不再停留在底层。它们正向上移动,通过目录进入治理领域,通过 Snowflake Intelligence 和 Databricks Genie 进入交互系统,并最终迈向智能系统。这就是它们跨越的卢比孔河。
关注下图——最左侧——交互系统。这是用户与智能体和数据交互的地方。模型制造商正在这里强力推进。ChatGPT 正向 Codex 发展。Claude 正演进为 Cowork[2]。当智能体代表你行动时,它不仅产生文本——它还会发出代码、调用工具、操作应用程序并访问数据。换句话说,聊天界面正围绕编码智能体工具链进行重构。这就是为什么 Codex 和 Cowork 属于这个交互层。它们正成为工作的新界面。这就是为什么埃隆·马斯克的 SpaceX 正在收购[3] Cursor。

但模型制造商存在结构性缺口。他们拥有强大的模型和日益强大的智能体工具链,但他们并不自然地拥有结构化的企业后端。他们可以生成代码、搜索网络并对提示进行推理,但如果目标是搜索企业知识、查询受控的业务数据并在组织内部采取行动,那么企业上下文必须以一种新的方式进行组织。这就是数据平台供应商、应用程序供应商和本体(Ontology)厂商发挥作用的地方。
Snowflake Intelligence 和 Databricks Genie 是这种企业数据新前端的早期示例。它们允许用户用自然语言与数据对话,但重要的部分不仅仅是界面,而是其底层的支撑。Snowflake Horizon 和 Databricks Unity Catalog 是组织治理元数据和定义的尝试,以便系统了解数据的含义、谁可以访问它以及应如何使用它。这仍然不是一个完整的智能系统,但它是一个起点。
绿色层——智能系统——是更大的竞争正在形成的地方。这是供应商试图将企业数据、规则、流程上下文和业务含义组织成智能体可用内容的地方。Glean Technologies Inc. 围绕人、文档和交互的个人图谱[4]来做这件事。微软公司拥有 Graph,现在通过 Work IQ 和 Copilot 365 表现出来,Fabric IQ 正向本体层迈进。Palantir Technologies Inc. 在这里更为成熟,拥有其本体。RelationalAI Inc.、Celonis SE、Salesforce Inc. 的 Data Cloud、SAP SE 的 Business Data Cloud 等都在试图拥有这部分企业上下文。
关键区别在于目录(Catalog)与智能(Intelligence)。目录提供定义,它告诉你指标的含义、数据存储位置、所有者以及适用的策略。这是必要的,但还不够。智能系统走得更远,它开始对业务流程逻辑本身进行建模——不仅是名词,还有动词。当业务规则、关系和行动变得实时、受控并最终可执行时,企业就从元数据迈向了智能。
这就是为什么顶层——代理系统——受到如此多关注,但它取决于其下方发生的事情。Microsoft Agent 365、Gemini Enterprise Agent Platform、Amazon Bedrock AgentCore 等都在追逐智能体的控制和编排层。但智能体只有在通过智能系统理解业务状态时,才能安全且有效地行动。艰巨的工作不仅仅是发布智能体,而是为这些智能体提供一个连贯的运作世界。
我们的观点是,这种分类法解释了下一阶段的竞争。大语言模型制造商将试图捆绑模型、工具链、界面和记忆;应用程序供应商将试图捍卫其领域;数据平台供应商将从存储和分析向上移动到治理、上下文和智能。赢家将是那些帮助企业以足够丰富的程度对业务进行建模的平台,使人类和智能体能够提出更好的问题、获得更好的答案并采取更安全的行动。
下图从 AI 栈分类法转向了我们认为企业正在努力构建的长期架构——业务的实时数字表示,即企业数字孪生(Enterprise Digital Twin)。这是北极星。它将确定性软件(记录系统、BI 系统、事务系统、受控数据)的可靠性与 LLM 等概率系统的创造力和生成能力结合在一起。重点不是用一种取代另一种,而是让它们协同工作,以便智能体能够协调工作、辅助判断并最终以日益增长的信心采取行动。
在我们看来,这之所以如此重要,是因为当今企业工作的很大一部分仍依赖于人类判断。人们处理例外情况、裁决边缘案例、应用部落知识、调和冲突信号,并在规则不明确时决定做什么。最初,AI 在协调工作(路由、总结、调和、搜索、匹配和组织)方面将最强。随着时间的推移,随着系统从专家那里学习并捕获决策背后的证据,更多以判断为导向的工作将被纳入这个数字孪生中。但我们认为这在今天尚未实现。这将需要数年时间才能成熟,因为企业不仅要对数据进行建模,还要对规则、上下文、行动和推理进行建模。

上图将智能系统拆解为五个层级。底层两层构成了确定性数字孪生——基础。第 1 层是映射层,本质上是企业的“罗塞塔石碑”。大型公司拥有成百上千个运营应用程序和分析数据孤岛。当业务提到“客户”、“订单”、“账户”或“资产”时,系统必须在所有不同的应用程序和属性中映射该概念。没有这一点,你甚至没有一个通用的对象模型。
第 2 层是规则层。一旦企业拥有了通用对象,它就必须对这些对象如何交互以及业务必须如何运行进行建模。这些是目前被封存在运营应用程序内部的确定性规则——例如客户是否可以获得信贷、订单是否可以发货或工作流是否被允许继续。我们的观点是,这些规则必须成为协调一致的资产,就像数据在几十年前成为资产一样。
上三层构成了认知数字孪生——推理层。
第 3 层是制度记忆。这是系统开始捕获企业暗物质的地方——之前发生了什么、专家考虑了什么、采取了什么行动、什么证据支持这些行动以及什么条件塑造了决策。这不仅仅是一个文档库,它是一个可搜索的专家推理轨迹记录。
第 4 层是决策指导。这是制度记忆被综合为建议的地方。当人类或智能体即将做出决策时,智能系统可以将业务的确定性状态与先前的专家推理相结合,并提供建议。在这种条件下,鉴于之前发生的事情和业务的当前状态,我们接下来应该做什么?这就是 AI 开始从协调转向判断支持的地方。
第 5 层是学习与反馈,我们认为它是最少被理解但最重要的层级之一。这是智能体的行为排气(Behavioral Exhaust)。它捕获智能体如何推理、它们做什么、它们使用什么证据、它们何时失败、人类何时干预以及结果如何随之改变。这成为了新的大数据。在 2010 年代,企业收集点击流数据以了解人们如何与网站交互;在智能体时代,企业将收集智能体推理和行动轨迹,以了解智能体如何与业务流程交互。这些数据的体量可能比云原生应用程序的传统可观测性数据大几个数量级。
结论是,智能系统不是一个在 2026 年神奇出现的单一产品层,而是一个随时间成熟的多层架构。一些部分已经存在:目录、治理元数据、可观测性工具、流程挖掘、知识图谱和智能体框架都在发挥作用。但最终状态更具雄心,并将形成为一个确定性和认知性的数字孪生,它了解业务状态、捕获规则和例外、支持人类判断并教导智能体进行改进。
这就是为什么 AI 计划的弧线对于成熟企业来说将在更长的时间跨度内形成。迈克尔·戴尔、摩根大通的杰米·戴蒙、亚马逊的安迪·贾西、谷歌的桑达尔·皮查伊等首席执行官都从上而下推动了 AI。与此同时,个人已经在使用 NemoClaw、Hermes Agent 和其他开源框架构建智能体。自下而上的运动是真实的。挑战在于确保这些个人智能体和技能最终接入这种架构,而不是产生新一代互不连通的孤岛。
尽管北极星是企业数字孪生,但现实世界不会一步到位。下图展示了更务实且混乱的路径,即智能系统将首先围绕数据孤岛出现。Snowflake 将试图协调和丰富其控制的数据;Databricks 将围绕其湖仓和 Unity 中心生态系统做同样的事情;Salesforce Data Cloud、SAP Business Data Cloud、Microsoft Fabric IQ 等将围绕它们最了解的业务数据创建特定领域的智能层。

这不一定是坏事。事实上,这可能是市场前进的唯一务实方式。客户已经拥有碎片化的资产,没有企业会等待一个完美的星际数字孪生出现才部署智能体。Salesforce 可以组织与客户相关的数据;SAP 可以组织后台和运营数据;Snowflake 和 Databricks 可以组织与其平台绑定的分析和非结构化数据。这些特定领域的层级成为早期的智能系统——不是最终的企业级系统,而是有用的覆盖层,让客户能够在业务的有限领域内提出更好的问题并使行动付诸实践。
重要的细微差别在于,这些覆盖层并不一定提取并取代客户的分析资产。在许多情况下,它们位于其上方,与之同步、丰富它或缓存其部分内容,以便供应商能够为其领域创建更有用的模型。例如,Salesforce Data Cloud 并不试图成为整个企业数据资产,它试图使与客户相关的数据更易于用于分析和智能体行动。SAP Business Data Cloud 对运营和业务流程数据也有类似的雄心。这意味着早期市场将充满部分数字孪生——每一个都有用,但每一个都不完整。
这产生了一种核心战略张力。SaaS 供应商正在智能体世界中争夺相关性。他们希望将确定性业务逻辑与概率 AI 结合起来,与 LLM 供应商合作,并将安装基础保持在自己的控制平面内。他们不想成为 Snowflake、Databricks、Palantir 或任何其他水平智能系统的被动馈送源。如果他们仅仅成为另一个数据源,他们的差异化和定价权就会下降。
这就是为什么每个供应商都希望其数据层作为高价值工作流中的一等公民对智能体可见。如果供应商拥有智能体行动的运营平台,它就能看到工作成果、影响结果,并可能以更接近工作单位或业务成果的价格进行定价。如果它只是将数据馈送到别人的智能层,它就会被推向消费定价。那是一个吸引力小得多的经济地位。
我们的观点是,下一阶段看起来像是一个儿童堆叠游戏[5]。每个供应商都将试图将其智能层置于其他层之上,使其领域成为智能体运作的地方,并试图拉拢工作流。客户的问题在于,这可能会重现我们已经拥有的碎片化软件景观——只是现在每个孤岛内部都有智能孤岛和智能体在行动。这可能有助于个人生产力和特定领域自动化,但它无法实现完整的数字孪生愿景。
前进的道路是务实地使用这些孤岛,而不将它们误认为是目的地。(不要寄希望于一日构建起的大厦,并期待其长久运行)客户应在可用之处获取生产力收益,但也应迫使供应商实现互操作性、共享治理、通用身份、一致的语义和更广泛的企业本体。不幸的是,科技行业的历史表明这是一个遥不可及的目标。
无论如何,最大的价值将归属于那些能够跨领域建模业务实际运作方式的平台。该模型的范围和保真度将决定智能体向何处聚集、它们能做什么工作以及它们能多安全地帮助运行业务。
下图开始剖析智能系统的基础层如何随时间成熟。重点不是企业从今天的数据平台直接跳跃到完整的企业数字孪生,他们不会这样做。务实的路径是分阶段移动,每个阶段都增加了业务模型的范围和保真度。这一点很重要,因为数据模型的复杂性决定了分析的复杂性,而分析的复杂性决定了人类和智能体能多自信地采取行动。
这是下表背后的核心理念。如果数据模型很浅,系统大多只能告诉你发生了什么;如果模型具有协调一致的实体和实时事件,系统就可以开始诊断和预测;如果模型捕获了关系、行动空间、实时状态和流程逻辑,那么系统就开始从分析转向运营。这就是从商业智能到企业智能的路径。
Snowflake 的近期势头[6]是这种情况如何形成的良好早期示例。随着自然语言接口使数据更易于查询,更多人查询更多数据。这些查询变得更加计算密集,因为智能体不仅仅运行静态仪表板。它们提出后续问题、收集上下文,其行为更像深度研究工作流而非预编译报告。这可以推动消费和货币化,这对 Snowflake 等平台有利,但也为客户带来了未来的成本问题。当智能体查询成为主流时,某人的预算将感受到影响。

该幻灯片列出了九个成熟度级别:
较低级别非常熟悉。大多数企业多年来一直致力于级别一到三的版本。他们拥有仪表板、报告立方体、指标、目录、治理元数据,以及日益增多的实时更新数据的事件流。这是我们期望 Snowflake 和 Databricks 展示更多进展的地方——特别是在自然语言查询、目录、治理和实时数据更新方面。
中间级别是模型变得更具表现力的地方。在级别四,系统开始识别行为;在级别五,它将概率转化为可用的业务信号;在级别六,企业开始将业务关系表示为丰富的对象,而不仅仅是行和列。销售不再仅仅是一笔交易,它成为一个相关实体的网络——例如客户、订单、SKU、促销、库存、履行中心、承运人、付款、风险和时间。这就是图谱思维变得重要的地方,也是为什么 Neo4j、Salesforce Data Cloud 和 SAP Business Data Cloud 等参与者出现在这些中间层的原因,通常以特定领域的方式。
级别七是模型开始变得更有趣的地方。销售不再仅仅是发生事情的记录,它成为一组可能的行动——例如应用促销、预留库存、授权付款、拆分发货、通知客户、升级给智能体或暂停交易。这些行动不仅仅是埋在应用程序代码中的 API 调用,它们变得可建模且受控。系统知道可以做什么、在什么前提条件下以及具有什么预期效果。这就是为什么 Palantir 在栈中显示得更高。它的本体已经进一步深入到建模行动和运营决策中,尽管通常伴随着繁重的客户特定工作。
级别八是实时运营状态。系统知道现在正在发生什么,而不仅仅是昨晚发生了什么。它知道客户的购物车、产品的当前库存、付款授权、履行中心的负载以及承运人的提货窗口。“已预留”意味着现在已预留,而不是昨天的快照。这就是智能系统开始表现得更像运营事实层的地方。
级别九是最具雄心的状态。流程逻辑成为数据。改变业务运行方式成为数据更新,而不是代码部署。系统可以对流程本身进行推理并加以改进。对于大多数企业来说,这仍然遥不可及,但它定义了 AI 企业承诺的方向。这就是为什么我们将 RelationalAI 显示在模型顶部附近。其雄心是以一种可以查询、推理并最终执行的方式表示业务逻辑、规则、关系和流程。
对客户而言,重点在于这些级别不仅仅是抽象的成熟度阶段。它们决定了可以提出什么问题、什么答案可以信任以及智能体可以安全地采取什么行动。级别一系统可以告诉你发生了什么;级别三系统可以实时更新答案;级别六系统可以解释关系;级别七或八系统可以推荐和协调行动;级别九系统开始使企业本身可编程。
我们的观点是,这是未来十年企业 AI 背后的架构。数据模型的丰富程度决定了智能的丰富程度,而智能越丰富,智能体就越有价值。那些帮助客户沿此成熟度曲线向上移动——同时不创建另一套孤岛——的平台将是最重要的。
本节采用九级成熟度模型,展示了为什么数据基础决定了企业的分析上限。换句话说,业务模型越丰富,系统能回答的问题就越丰富;答案越丰富,人类和智能体在采取行动时就越有信心。

在上述栈的底部,级别一和二再次是熟悉的领域。这是部门快照、指标、维度和实体解析的世界。企业可以提出基本问题,例如:在春季促销期间购买的黄金级客户的每单支出是否高于青铜级客户?这很有用,但仍然不成熟。单个客户隐藏在聚合维度中。你可以看到发生了什么,但系统无法真正解释原因。没有序列,没有因果关系,因此没有扎实的建议。
级别三和四开始推动企业从描述性分析向诊断和早期预测迈进。事件按时间顺序保留,行为标签被分层叠加在上面。现在系统可以将结果分解为一系列事件。系统不再仅仅说客户购买了帐篷,而是可以问:为什么玛丽的帐篷购买转化得如此之快?在级别四,模式有了名称。玛丽是一个受交易驱动的补货者。她响应了促销,在某个类别中进行了补货,并迅速通过了漏斗。这是一类不同的分析,因为系统开始解释行为,而不仅仅是计算交易。
级别五和六进入规范和优化领域。现在系统不仅描述玛丽的行为,还携带关于她及其周围实体的持续更新的预测。玛丽在 30 天内在此类别中回购的概率为 68%,她因两次延迟交付而面临 19% 的流失风险。在级别六,这些关系可以通过图谱进行遍历。客户、SKU、促销、履行中心、交付历史、承运人、订单和服务体验都是连接的对象。问题变得更尖锐、更个性化且更具可操作性。
级别七到九是模型开始从分析跨越到运营的地方。在级别七,业务的可能性空间变得清晰。系统不仅知道发生了什么,还知道可以做什么。它理解具有前提条件和效果的行动。例如,在春季促销期间所有处于结账过程中的订单中,哪些订单有资格进行拆分发货,这对交付时间会有什么影响?
级别八使业务的当前状态变得可知。这是模型不再是快照的时刻。它可以回答整个业务中现在什么是真实的:还剩下多少帐篷库存、多少购物车包含一个、哪些履行中心已满负荷、哪里出现了承运人延误。在级别九,业务的运营逻辑变得可检查。流程本身成为数据。系统可以询问诸如订单从购物车到结算的定义路径是什么、什么规则管理每个转换、订单实际上在哪里停滞与业务假设它们在哪里停滞之间的差异是什么?
序列如下:
我们的观点是,这是从商业智能迈向企业智能的务实路线图。它也解释了为什么数据平台之战正在向栈上层移动。价值不仅仅是存储更多数据或运行更快的 SQL,价值在于提高业务模型的表示复杂性,以便企业能够提出更好的问题、获得更自信的答案,并最终允许智能体采取有限的行动。
对于前往 Snowflake Summit 和 Databricks Data + AI Summit 的买家来说,这是关键点。自然语言查询和智能体分析将使数据更易于访问,并可能推动更多消费。但战略问题不仅是“我能与我的数据对话吗?”,问题还在于“我的平台能带我走多远?”因为答案决定了 AI 是保持描述性和咨询性,还是变得规范性、运营性并最终实现自我改进。
前一节侧重于分析数据基础的成熟度——企业如何从孤岛式指标和静态快照转向更丰富的模型,从而能够诊断、预测、规范并最终模拟。下一张幻灯片迈出了下一步,并询问:“智能体在每个成熟度级别实际上能做什么?”
答案是,智能体行动受到数据模型及其之上构建的分析复杂性的限制。将 ChatGPT、Claude 或任何前沿模型投入企业只是第一步。模型可以推理,但企业必须为它们提供业务的结构化表示。表示越丰富,分析就越复杂;分析越复杂,智能体就能越安全地采取行动。

在级别 1 和 2,本质上没有真正的智能体行动。这是供应商去年开始展示的“与你的数据对话”阶段。智能体可以读取数据、使用指标和维度、用自然语言回答问题并生成仪表板或对话响应。这是 Snowflake Intelligence 和 Databricks Genie 等功能开始的地方。它们使数据更易于访问,但人类仍然解释输出并决定做什么。系统可以帮助查找信息,但它尚未运营业务。
这对 BI 层有一个重要的启示。一旦交互系统能够基于受控指标和维度生成用户界面,仪表板就变得不那么手工制作,而更具动态性。如果平台拥有指标和维度定义,它就可以按需生成仪表板。这就是为什么语义层的控制如此重要。如果交互系统可以直接从受信任的业务定义创建界面,BI 工具的重要性就会降低。这是微软限制 Databricks 对 Power BI 访问的举措值得注意的原因之一。竞争不仅在于仪表板,还在于谁控制了生成业务视图的定义。
级别 3 和 4 进入初步的细分级别建议。这是系统开始看到行为信号并能为群体推荐行动的地方。Salesforce Data Cloud 风格的示例可能会说,表现出玛丽犹豫模式的类似客户在 48 小时内收到折扣时转化率要高得多。这是一个有用的建议,但它仍然是启发式的。营销人员仍然决定是否采取行动。智能体可能会执行活动,但人类发起或批准决策。
级别 5 和 6 变得更加精确和个性化。系统不再进行广泛的群体建议,它可以为特定实体、客户、账户、订单或资产生成量化的建议。例如:向玛丽发放免费送货服务,预计这将使她的流失风险从 19% 降低到 7%。这与“为此细分市场开展活动”有本质区别。建议与特定客户、特定预测结果和特定行动挂钩。人类仍然在循环中,但系统开始提供决策级的指导。
级别 7 到 9 是行动模型发生变化的地方。在级别 7,行动本身被建模。智能体可以对行动空间进行推理,而不是仅仅调用硬编码的 API。它能理解目标是保持玛丽在可接受的利润率内、解决她的交付投诉,然后发放保留优惠。自主执行从这里开始,但仅在治理范围内。
在级别 8,智能体针对实时业务状态采取行动。如果系统在流程中发现玛丽想要的帐篷刚刚缺货,它可以替换替代品、推荐不同的优惠或在触发公司无法履行的操作之前停止行动。人类监督从批准每一步转向处理例外情况。
在级别 9,流程本身成为数据。智能体不仅在执行流程,它还在学习流程应如何改进。它可能会发现,在发放促销之前解决投诉能更有效地保留像玛丽这样受交易驱动的买家。系统随后有基础来推荐或最终调整流程。
流程如下:
这也是备份和恢复讨论变得更具战略意义的地方。在成熟的智能体系统中,企业不仅在备份数据,它还在捕获业务状态——智能体知道什么、它推理了什么、它采取了什么行动、它调用了什么工具以及为什么做出该决策。这是信任、恢复和学习的基础。如果智能体做错了什么,组织不仅需要了解发生了什么,还需要了解驱动该行动的逻辑。
结论是,智能体自主性不是一个开关,而是一个成熟度曲线。数据基础越丰富,分析就越复杂;分析越复杂,智能体就能越安全地采取行动。企业不应将“与你的数据对话”与自主运营混为一谈。它们相关,但处于非常不同的成熟度级别。
最后一张幻灯片放大了智能系统的第 3、4 和 5 层,因为这些层级将决定企业是仅仅部署智能体,还是围绕它们构建学习型组织。底层的确定性层级是必要的,因为它们映射业务并编码规则。但顶层是系统开始捕获判断、制度记忆和随时间改进智能体所需的推理排气的地方。

这里最重要的层级是第 5 层——学习与反馈。我们认为这成为智能体推理的新事实来源。在数据库世界中,预写日志(Write-ahead log)是真正的事实来源,因为它记录了表格更新之前发生的事情。在智能体世界中,等效的事实来源是捕获智能体如何推理、它们引入了什么上下文、它们进行了什么工具调用、工具返回了什么、子智能体如何交互以及做出决策时业务处于什么状态的可观测性基质。
这是一个比传统云可观测性大得多的数据问题。点击流推动了大数据运动,因为它们产生的数据量比传统分析系统所能处理的要大几个数量级。智能体排气可能产生另一次阶跃函数增长——数据量可能比可观测性平台为云原生应用程序捕获的数据大 1,000 到 100,000 倍。这不仅仅是事后诊断,它成为教导智能体、对其推理评分、对其发布进行门控并在生产中对其进行监控的系统。
这就是为什么可观测性、评估(Evals)、CI/CD 和智能体可靠性工程合并为一个基质的原因。评估对智能体的推理方式进行评分,这些分数成为部署过程中的门控;相同的轨迹被用于改进智能体的下一个版本;在生产中,可靠性智能体可以使用相同的基质在另一个智能体开始漂移、失败或违反策略时进行干预。这就是为什么 Snowflake 收购了 Observe,为什么 Databricks 正在将 MLflow 扩展到智能体可观测性,为什么 Datadog Inc. 在这一层级上处于有利地位,以及为什么 Braintrust Data Inc.[7] 等较新的参与者可能比人们意识到的更有价值。市场可能仍将其视为监控,我们认为它正成为智能体软件的学习系统。
第 3 层是另一个关键部分。这是上下文图谱——但不是浅层的“将文档扔进 RAG”意义上的。我们认为经典的检索增强生成(RAG)是不够的,因为它未能捕获嵌入在文档、对话、策略、合同和专家通信中的大部分结构。企业必须从非结构化知识转向结构化知识。这意味着提取、表示并服务于 90% 存在于传统数据库之外的企业知识。
这是一种新型的数据工程。旧的数据工程模型通过管道将运营数据转换为分析数据;新模型获取知识资产——文档、Slack 线程、电子邮件、合同、策略、通话记录、流程文档——并从中提取结构,以便智能体能够对其进行推理。Pinecone Systems Inc. 超越简单的向量嵌入向 Nexus[8] 的举措[9]是这一方向的一个良好示例。重点不是“向量搜索就足够了”,重点是企业知识必须变得足够结构化,才能成为智能系统的一部分。
第 3 层的第二部分是专家教学。这是领域专家向系统展示如何通过艰难决策进行推理的地方。他们记录良好的推理是什么样的、什么证据重要、适用什么权衡以及如何对决策质量进行评分。Mercor Inc. 等公司处于这个专家教学赛道,帮助创建可用于训练和评估智能体的准则和评估。这一点很重要,因为许多业务决策不是确定性的。规则可能冲突,证据可能不完整,外部上下文可能改变答案。当这种情况发生时,智能体需要的不仅仅是访问文档——它们需要专家如何推理的示例。
第 4 层是制度记忆转化为指导的地方。系统将先前的专家推理、确定性业务规则和业务当前状态综合为建议。在某些情况下,置信度将足以让智能体采取行动;在其他情况下,系统将呈现证据并要求人类做出决定。无论哪种方式,结果都会反馈到第 5 层,在那里决策、推理和结果成为学习循环的一部分。
结论是,智能系统不仅仅是一个语义层或目录,它是一个捕获知识、推理判断、智能体行为和反馈的生命系统。这些层级解释了为什么数据平台、可观测性供应商、模型制造商和智能体框架都在向同一领域汇聚。客户面临的风险是锁定。如果智能体平台拥有可观测性、评估、记忆和学习循环,切换模型或平台将变得极其困难。这就是为什么企业应该仔细考虑谁拥有这些层级,以及这些智能随时间的可移植性如何。
我们的最终观点是,个人智能体将引发企业 AI 的生产力繁荣,但企业优势最终将来自学习系统。获胜的企业将捕获工作是如何完成的、决策是如何做出的、智能体是如何推理的以及业务如何从每一次交互中改进。这是从个人生产力迈向组织智能的基础。
首席 AI 官应鼓励自下而上地采用个人智能体,但只能在防止产生新一代智能孤岛的自上而下的架构内进行。每一个被证明有用的智能体、技能、工作流和数据产品都应有一条成为受控企业资产的路径——与通用身份、共享本体、数据治理、策略、可观测性、评估和审计追踪挂钩。任务不是减缓实验,而是确保本地生产力收益能够馈送组织智能,而不是形成互不连通的自动化孤岛。
最大的陷阱是让每个部门——或者更糟的是,每个供应商——定义自己的智能系统。前沿模型至关重要,但企业运营上下文不能盲目外包给模型制造商捆绑的智能体环境。首席 AI 官的工作是与业务和技术团队协作,定义智能体能够在整个业务中安全推理和行动的架构。共享数据定义、业务规则、流程上下文、智能体轨迹、学习循环和治理应被有意地纳入其中。个人智能体点燃导火索;企业级智能系统决定了这种能量是成为持久优势,还是成为以机器速度移动的另一个孤岛问题。
原文标题:Personal agents light the fuse as Snowflake and Databricks move up the AI stack
---【本文完】---