覆盖结构化数据、AI 领域的非结构化数据源与模型资产的多模态统一数据目录服务。
内置全托管存储的批流一体 TCIceberg 表格式,在满足流式湖仓场景拓展同时兼容 Apache Iceberg。
自动优化 TCLake 底层数据,包括小文件合并、无效数据清理、数据组织优化、生命周期管理等。
提供开放上层生态接入,包括腾讯云大数据 & AI 产品生态、Spark、Flink、TensorFlow 等开源生态。
多模态智能数据湖 TCLake 主要计费内容包括:元数据管理费用、数据优化费用、托管存储费用等。邀测期间元数据、数据优化等服务暂不收费,当您使用的表或数据托管在 TCLake 中时,会收取托管数据存储费用,托管存储费用采用按量计费模式,费用由 存储容量费用 和 请求费用 组成。
计费项 | 计费项说明 | 计费公式 |
|---|---|---|
存储容量费用 | 根据存储容量的大小进行计算,不同存储类型的单价不同 | 日存储容量费用 = 存储容量月单价 / 30 * 日存储容量日存储容量 = 当日“每5分钟存储容量”之和 / 288(采样点数) |
请求费用 | 根据请求次数进行计算,不同存储类型的请求单价不同 | 请求费用 = 每 万次请求 单价 * 日累计请求次数 / 10000 |
地域 | 存储容量费用(元/GB/月) | 请求费用(元/万次) |
|---|---|---|
北京、南京、上海、广州 | 0.118 | 0.01 |
说明:
存储服务产生账单您可前往费用中心通过“数据湖计算 > 数据湖存储”产品查看。
填写邀测 申请表单 ,我们将尽快完成邀测资格的审核。邀测阶段面向受邀用户开放,邀测时间为2025年9月30日~2025年12月31日,邀测结束后,您可以继续使用服务。
登录 TCLake 控制台,按照指引单击开通服务,服务开通不收取费用。
完成开通后,可按照控制台快速入门指引创建数据目录。
多模态智能数据湖 TCLake 目前处于邀测阶段并在快速迭代中,过程中如有任何使用问题和建议,可 提交工单 联系我们。
用户在 TCLake 基于同一份湖存储数据构建多计算引擎应用,如基于 Spark 的批处理、基于 Flink 实时链路、基于 TCHouse 的高性能分析、基于 SparkML的机器学习应用等,解决传统架构下离线、实时、交互分析多套数据体系割裂问题。同时通过统一元数据整合 LakeHouse 数据资产、提供智能数据优化、加速等服务,可大幅提升客户数据维护及使用效率。
将企业的结构化和非结构化数据导入数据湖中,并通过 TCLake 统一数据目录服务将企业其他分布在各异构系统的多模态数据,与 TCLake 自身已有的数据资产无缝整合并实现统一管理,为管理人员提供全局可视的资产管控界面,同时为上层应用提供标准化的全域数据接入、统一权限控制及全生命周期治理能力,彻底打破数据孤岛,减少数据移动,大幅提升数据管理及使用效率。
通过 TCLake 的多模态数据管理能力及开放引擎生态,可助力客户快速搭建大数据+机器学习一体化应用,上游大数据引擎如 Spark 预处理好的训练数据可直接注册回统一元数据,由下游 PyTorch、TensorFlow 等 Al 训练框架直接读取,完成训练后模型可注册回 TCLake 进行统一生命周期管理,大幅提升 Al 应用构建及管理效率。