叮咚✨欢迎走进「数据极客圈」!专注大数据、AI 技术交流,大咖分享一线经验,持续输出实用技术锦囊。聚集同行伙伴,交流共进,欢迎关注加入!
随着 AI Agent、RAG 知识库、ChatBI 智能分析全面普及,大模型 / 智能体要读取业务实时数据,通常需要单独开发 API、做权限封装、处理多数据源适配。一套 RAG 链路往往要对接向量库 + 数仓 + 检索引擎,开发周期长、链路复杂。
Apache Doris 原生 MCP Server(Model Context Protocol),作为 AI 与实时数仓的标准化桥梁。任意兼容 MCP 协议的大模型、Agent、低代码 AI 平台,都可以通过统一的协议直接调用 Doris 的查询、元数据、执行计划、慢查询诊断等能力,无需二次开发数据接口。
MCP(Model Context Protocol)是基于 JSON-RPC 2.0 的标准化 AI 工具交互协议,统一规范了工具调用、资源读取、流式返回、权限鉴权。Claude、Cursor、Dify 等兼容 MCP 的客户端无需为不同大模型单独适配数据接口。
Doris MCP Server 是官方开源的独立服务(Python + FastAPI 实现),部署在 Doris 集群外侧,作为中间层承接 AI 客户端请求,封装 Doris 底层能力,对外输出标准化的工具集。
AI Agent / Dify / Claude → MCP Server → Apache Doris 集群
当前版本(v0.6.0)共注册 25 个工具,涵盖以下类别:
get_db_list — 列出所有数据库get_db_table_list — 列出指定库的所有表get_table_schema — 查看表字段、类型、注释等结构信息get_table_comment — 查看表注释get_table_column_comments — 查看所有列注释get_table_indexes — 查看表索引get_catalog_list — 列出所有 Catalog(含 Iceberg/Hudi 等外部数据源)exec_query — 执行任意 SQL 查询get_sql_explain — 获取 SQL 执行计划get_sql_profile — 获取 SQL 执行 Profile 用于慢查询诊断get_table_data_size — 查看表数据大小get_recent_audit_logs — 查看审计日志get_monitoring_metrics — 获取 FE/BE 监控指标get_memory_stats — 获取 BE 节点内存统计(实时 / 历史)get_table_basic_info — 表基本信息(行数、列数、分区等)analyze_columns — 列级数据分析(完整度、分布)analyze_table_storage — 表物理存储分析analyze_slow_queries_topn — 慢查询 Top-N 分析零售企业实时销售数据全部存储在 Apache Doris,包含订单明细表、商品维度表、渠道汇总表。
需求:搭建 ChatBI,让运营、销售同事直接用自然语言查询实时销量、同比增长、爆款商品,无需找数据分析师写 SQL。
# 方式一:从 PyPI 安装
pip install doris-mcp-server
# 方式二:从源码安装
git clone https://github.com/apache/doris-mcp-server.git
cd doris-mcp-server
pip install -r requirements.txt
# 修改环境变量
cp .env.example .env
# 然后在.env 里面添加Doris的配置
vim .env
# 然后直接启动
./start_server.sh
启动后会看到日志

curl http://127.0.0.1:3000/health
返回 healthy 代表部署成功,MCP 接口地址为 http://IP:3000/mcp。

http://你的服务器:3000/mcp)


你是Doris企业专属实时数据分析助手,仅允许调用Doris MCP工具查询数据。
1. 用户提问后,先调用 get_db_list 查看可用数据库,再调用 get_table_schema 获取相关表字段;
2. 根据业务语义生成标准 Doris SQL,使用 exec_query 执行查询;
3. 返回结果做汇总分析,支持同比、环比、排序统计;
4. 禁止编造不存在的数据,无相关数据直接如实告知用户;
5. 时间类数据优先从汇总层查询,保证查询速度。
AI 自动执行链路:
get_db_list 找到销售业务库;get_table_schema 读取订单明细、商品维度、渠道汇总三张表结构;
Doris 实时明细层数据秒级查询,运营人员自助完成复盘,无需人工写 SQL。

Agent 时代的数据底座需要打通 AI 应用的标准化交互通道。Apache Doris MCP Server 针对「AI 与数仓对接复杂、多组件割裂、实时性不足」三个核心痛点: