首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯云TBDS构建中国医学科学院肿瘤医院国产湖仓一体数据底座

腾讯云TBDS构建中国医学科学院肿瘤医院国产湖仓一体数据底座

原创
作者头像
IT资讯研究所
发布2026-06-12 11:37:59
发布2026-06-12 11:37:59
00
举报

应对国产化替代、合规监管与技术迭代三重压力

国家肿瘤信息数据共享平台在建设过程中面临底层技术架构的战略重构需求。核心痛点集中在三个维度:

  1. 国产化替代浪潮:原有底层IT基础设施(算力、存储、数据库)亟需完成关键技术自主可控,消除外部技术依赖。
  2. 合规与监管要求升级:医疗数据安全、隐私保护及行业信创标准日益严格,现有架构面临严峻的合规性整改压力。
  3. 技术栈迭代困境:原有CDH体系版本老旧且社区更新停滞,无法支撑湖仓一体及Data+AI融合需求,技术栈面临淘汰风险。

在此背景下,国家抗肿瘤药物临床应用监测网作为核心业务载体,已完成800家医院的自动化接口对接,并要求监测单位数据及时报送率及整体质控合格率超过70%

部署分层解耦的TBDS湖仓一体架构

采用腾讯大数据处理套件(TBDS)作为国产自主可控的核心数据基座,构建“湖仓一体”全场景数据底座。技术实施路径包括以下关键模块:

  • 接入与计算层:通过Kyububi SQL接入网关实现多租户体系与多集群管理;计算层支持Spark容器化版本、Trino MPP、Flink流计算及ES搜索等多种引擎适配。
  • 存储与格式层:采用Iceberg数据湖表格式,底层支持联邦HDFS与对象存储(Object Storage),兼容On-Premise(本地)、On-Cloud(公有云)、On-Hybrid(混合云)三种部署模式。
  • 资源调度与治理:融合Hadoop体系资源调度(YARN)与Kubernetes云原生调度;数据治理层面集成Hive Metastore与Optimizer Service,并配备Ranger/Kerberos/LDAP安全体系。
  • 管控底座:基于TCS底座的TBDS Manager提供安装部署、日志服务、集群管理及资源分析能力。

实现系统性能与数据处理能力的量化突破

基于TBDS的架构升级,国家肿瘤信息数据共享平台在性能、容量及成本上达成以下具体指标:

  1. 性能与资源优化:基于开源组件深度优化,综合性能提升30%+资源利用率提升50%+,同时运营成本降低30%+
  2. 规模与扩展性:单集群支持万节点规模,单项项目支持10万+节点;日接入数据量达百万亿条,日实时计算量达5万亿次
  3. 核心业务指标
    • 可用性:平台可用性标准达99.999%,具备容灾备份体系。
    • 数据处理上限:实现千亿级肿瘤数据的高效处理与管理。
    • 数据规范:监测网数据收集范围从19类27张表单精简为18类24张表单;2024年监测报告纳入3类68项监测指标,新增治疗方案临床指南依从性等维度。
  4. 全栈国产适配:完成底层软硬件全栈国产适配,支持国密安全算法及DSM/DSMM3认证,消除外部技术依赖。

契合国家战略,构建国家级高可信数据支撑体系

该平台建设不仅解决了技术底座问题,更在业务层面实现了国家级战略价值:

  • 数据体系建设:建成国家级肿瘤临床研究高可信数据支撑体系,一级数据库包含65个标准化变量,二级数据库包含173个标准化变量,支撑多模态数据共享与协作。
  • 科研转化效率:数据治理与分析链路耗时大幅缩短,临床试验患者入组效率显著提升,加速科研成果转化。
  • 行业标准引领:紧密契合“健康中国2030”国家癌症防治战略,致力于形成一套可复制、可推广的国产化医疗大数据平台建设标准与落地路径。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 应对国产化替代、合规监管与技术迭代三重压力
  • 部署分层解耦的TBDS湖仓一体架构
  • 实现系统性能与数据处理能力的量化突破
  • 契合国家战略,构建国家级高可信数据支撑体系
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档