本文共计4189字 预计阅读时长13分钟
随着企业数据规模持续增长,数据团队普遍面临开发协同效率不足、数据一致性难以稳定保障、AI 场景落地链路偏长等挑战。WeData 2月版本围绕数据开发、数据集成、数据科学、数据治理四大核心模块全面升级,覆盖从开发协同、实时同步到 AI 落地与合规管控的关键环节,进一步提升端到端能力,以一体化方案助力企业打通数据链路、释放数据价值。
1
数据开发:一体化 + 工程化,
效率与规范双提升
1.全新Studio数据开发IDE,开发体验革新


2.WeData Bundle工程化交付,融入企业 DevOps
数据开发与发布长期依赖人工配置和跨环境迁移,容易出现版本不可追溯、环境不一致、漏配错配等问题,交付效率与稳定性难以保障。为此,WeData新增 WeData CLI与WeData Bundle,提供面向数据工程的CI/CD方案:CLI支持命令行操作与自动化集成;Bundle将工作流、任务等开发资源源文件化,沉淀为可管理、可审计的文件包,纳入企业现有工程体系。结合GitLab Pipeline等CI/CD流水线,可在提交后自动完成跨环境发布与迁移,并支持工作流/任务YAML 在线预览与快捷生成,进一步降低配置成本。最终让数据资产像代码一样进入流水线,实现自动化部署,把跨环境迁移从“半天手工配置”变成“一条命令完成”。

3.编排空间丰富任务类型和调度模式
2
数据集成: 构建全球互联、
多模态融合与高可靠的全域
数据连接服务
1.全球化链路覆盖:打破地域限制,加速海外业务布局
针对企业出海或多云架构下海外数据源接入难、链路扩展性差的挑战,WeData新增了对AWS S3、Azure Blob Storage、BigQuery等海外数据源的支持,同时实时整库迁移任务新增 30+ 条同步链路,助力企业构建全球化数据互联网络,将新业务接入周期从周级缩短至天级。
2.多模态数据同步:激活沉睡资产,实现全域数据入湖
面对本地及云端大量非结构化数据(如文档、图片、日志)难以统一入湖分析的痛点,WeData现支持将本地及COS文件一键上传至多模态数据湖,全面补齐数据资产版图,为后续的 AI 训练与大数据分析提供全量、高质量的“原始燃料”,实现全域数据资产的一站式掌控。
3.数据对账:从“人工抽检”到“分钟级监控”,捍卫数据一致性
在金融、电商等对数据准确性极度敏感的场景中,针对丢数、错数导致报表失真且人工核对效率低的问题,我们推出全量与增量双模式对账功能,实时监控源端与目标端在数据条数、数据内容上的差异,将一致性问题的发现时间从天级缩短至分钟级,确保每一条数据都精准无误。

4.整库灵活配置:兼顾高效与灵活,实现精细化管控
针对大规模整库同步时无法兼顾单表差异化需求、导致运维成本高昂的困境,WeData支持按单表粒度配置字段映射与数据过滤,让用户在享受整库同步便捷性的同时,获得精细化的管控能力。

5.轻量ETL转换:同步即清洗,开启“入库即可用”新模式
面对源端数据格式杂乱、二次清洗链路长且计算成本高的现状,我们在同步过程中集成了轻量ETL转换,内置JSON、哈希、时间等六大类函数库,实现“同步即加工”,简化了50% 以上的处理链路,显著提升数据流转效率,让数据价值的释放更加实时高效。
3
数据科学:模型训练和服务,
全链路闭环,加速AI规模化落地
1.全链路追溯与精细化权限管理

2.特征管理能力全面升级


3.模型服务和训练能力持续优化
4.无代码建模AutoML
无代码AutoML:覆盖分类、回归、时间序列预测等核心场景,让用户无需深入掌握机器学习算法和调参细节,也能高效地完成数据预处理、特征工程、模型选择、超参数优化、模型评估等一系列机器学习任务。将AI建模的门槛从“需要算法工程师数周开发”降低为“业务人员数小时自助完成”。

4
数据治理:全域统管+质效双升,
夯实AI-Ready智能数据根基
1.支持指标加速,开放指标服务


2.统一元数据管理
通过构建Catalog→Schema→Table/View/Model/Volume/Function三层元数据管理架构,统一纳管结构化数据、模型与非结构化数据;支持一站式查看元数据基础信息、表血缘、模型血缘、变更历史、数据质量、访问日志及使用说明,并提供全域统一的权限管控能力。

3.升级质量监控,覆盖模型训练数据和模型质控
针对模型训练数据和模型质量,通过自动化的质量管控预警数据漂移与性能衰减风险,并支持配置Dashboard查看推理表、时序表和快照表等关键质量指标,降低AI运维成本。

图1:基础分析

图2:推理分析-公平性和偏差

图3: 漂移监控-数据漂移指标
5
WeData核心链路OpenAPI重构,
覆盖四大核心模块
本次更新完成了WeData核心链路OpenAPI全面重构,覆盖平台基础、数据开发、任务运维、数据资产四大核心模块,优化接口逻辑与调用体验,提升平台开放能力与系统稳定性。
WeData OpenAPI可显著提高系统集成与互操作性,实现与企业现有系统的无缝对接,支持与第三方工具和平台的灵活集成;通过 API 形式实现定制化能力,满足企业特殊业务需求,灵活扩展平台功能,适应不同业务场景。通过 API 实现数据开发流程的自动化,支持程序化调用,减少手工操作,帮助企业在数据构建和应用的过程中减少重复开发工作,加快项目交付速度。
未来,WeData将持续增强Data+AI的企业级数据智能平台的功能,帮助各行业客户加速释放数据与智能融合价值。
点击“阅读原文”立即进入WeData开启产品体验→