
过去两年,我接触了上百家正在落地AI的企业。有一个问题反复出现:
“我们用了很多AI能力——GPT-4、Claude、DeepSeek、各种开源模型。每个人都用得挺嗨,但作为技术负责人,我问自己三个问题,一个都答不上来:
这不是个别现象。
AI工具的普及速度,远超企业组织能力的建设速度。结果是:工具越强,管理越弱。
这篇文章想聊的,是一个更底层的问题:企业到底需要一个什么样的AI底座?
我们需要区分两个概念:
概念 | 定义 | 特点 |
|---|---|---|
AI工具 | 解决单点问题的软件 | 分散、异构、难以管控 |
AI底座 | 承载所有AI能力的平台层 | 统一、可管、可演进 |
AI底座不是又一个“AI应用”,而是让所有AI应用能够规范运行、有序沉淀、安全可控的基础设施。
基于这个定位,本文设计了一套四层架构:
text
┌─────────────────────────────────────────────────┐
│ 治理层 │
│ (资产沉淀、效果度量、成本归因) │
├─────────────────────────────────────────────────┤
│ 能力层 │
│ (Text-to-SQL、合同审查、入职档案解析) │
├─────────────────────────────────────────────────┤
│ 管控层 │
│ (多模型网关、权限管控、审计日志、安全防护) │
├─────────────────────────────────────────────────┤
│ 接入层 │
│ (统一API、SDK、WebSocket、回调) │
└─────────────────────────────────────────────────┘要解决的问题
在没有统一底座之前,每个AI应用都要自己对接模型厂商、处理API差异、管理密钥。结果是:重复造轮子、密钥散落各处、切换模型成本高。
设计思路
接入层的核心是统一API网关:
技术实现要点
yaml
# 统一API示例
POST /v1/chat/completions
{
"model": "gpt-4", # 统一模型名,底层自动路由
"messages": [...],
"temperature": 0.7
}接入层做的事情:
gpt-4路由到OpenAI、claude路由到Anthropic价值
指标 | 效果 |
|---|---|
新应用接入时间 | 从天级降到分钟级 |
模型切换成本 | 改一行配置 vs 改全部代码 |
密钥管理 | 统一管理 vs 散落各处 |
要解决的问题
企业环境里,AI不能“裸奔”。需要回答:
设计思路
管控层包含四个核心模块:
4.1 多模型智能网关
4.2 细粒度权限管控
text
权限模型:
- 用户级:张三可以调用,李四不可以
- 应用级:客服应用可以用gpt-4,内部工具只能用deepseek
- 场景级:高风险场景强制走审核流程4.3 安全防护与脱敏
4.4 审计日志
价值
能力 | 解决的问题 |
|---|---|
智能网关 | 模型厂商单一故障风险 |
权限管控 | 谁能用什么、用多少 |
安全脱敏 | 数据泄露风险 |
审计日志 | 合规审查、问题追溯 |
要解决的问题
企业常用的AI场景高度重复——合同审查、入职档案解析、Text-to-SQL、知识库问答……每个团队都在重复实现同样的功能。
设计思路
能力层封装了高频业务场景的端到端能力:
Text-to-SQL:自然语言直接生成SQL
合同审查:自动提取条款、标注风险
入职档案解析:自动提取身份证、毕业证、离职证明
知识库问答(RAG):基于企业文档的智能问答
使用方式
python
# 调用Text-to-SQL能力示例
from ai_base import TextToSQL
client = TextToSQL(db_connection="mysql://...")
sql = client.convert("查询上周活跃用户")
result = client.execute(sql)价值
能力 | 自建成本 | 使用底座方案 |
|---|---|---|
Text-to-SQL | 2-3人月 | 1周接入 |
合同审查 | 1-2人月 | 2天接入 |
入职档案解析 | 1人月 | 1天接入 |
要解决的问题
这是最容易被忽视、但长期来看最重要的一层。
很多企业用了一两年AI后,发现:
结果:AI能力无法沉淀为组织资产。
设计思路
治理层的核心是让每一次调用都变成可复用的资产:
资产沉淀
效果度量
持续迭代
价值
能力 | 解决的问题 |
|---|---|
资产沉淀 | 能力跟着人走 vs 能力留在平台 |
效果度量 | 凭感觉优化 vs 数据驱动优化 |
持续迭代 | 一次性的项目 vs 持续演进的平台 |
四层架构不是孤立的,而是层层递进、相互支撑:
text
用户请求 → 接入层(统一入口)
→ 管控层(鉴权、脱敏、限流)
→ 能力层(执行业务逻辑)
→ 治理层(记录日志、沉淀资产)一个完整的调用链路:
关键设计原则:
本文提出的四层架构,回答了一个根本问题:企业到底需要一个什么样的AI底座?
这四层不是一次性建成的。企业可以根据自身阶段,从最痛的点切入:
AI底座不是“又一个平台”,而是让AI能力能够规范运行、有序沉淀、安全可控的基础设施。
如果你也在思考企业AI底座的选型或自建,希望这篇文章能提供一些参考。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。