DataBuddy 覆盖数据接入、数据开发、数据治理、数据分析全链路任务,用户通过自然语言对话即可触发,具体包括以下任务类型:
• 从多种数据源(关系型数据库、NoSQL 数据库、消息队列、文件系统、API 接口等)同步数据到数仓
• 配置增量同步策略(按时间字段增量、按日志增量等)
• 配置调度策略(定时调度、事件触发调度等)
• 监控接入任务运行状态,异常时自动告警并建议修复方案
• 基于源表分析生成数仓分层设计(ODS、DWD、DWS、ADS 等分层)
• 生成目标表结构(字段定义、数据类型、分区策略等)
• 生成 ETL 代码(支持 Python 和 SQL 两种语言)
• 配置工作流编排和调度策略
• 执行代码调试和性能优化
• 自动巡检数据资产,发现数据编目、语义建模、数据质量、数据安全、血缘分析五大领域的问题
• 自动生成修复方案,并按风险等级分级执行(低风险自动完成,高危需人工确认)
• 维护数据血缘图谱,支持影响分析和根因追溯
• 生成数据治理报告和数据质量评分
• 智能问数(自然语言转 SQL)
• 指标归因分析
• 自动生成数据分析报告
• 搭建可视化看板
• 异常检测和预警