首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深度学习与python

    数据平台如何进行原生改造

    此时,原生数据平台的高弹性扩展、多租户资源管理、海量存储、异构数据类型处理及低成本计算分析的能力,受到了大家的欢迎。但企业应该如何做好大数据平台原生改造和升级呢? 这个改造是不可避免的,基于原来 Hadoop 生态体系的大数据平台一定会迁移到原生平台。 InfoQ:Twitter 什么时候开始做原生数据平台的?当时为什么要做?效果如何? 所以,不能在平台上跑的应用一定会被淘汰。 InfoQ:现在使用原生数据平台的主要是哪些类型的企业?企业数量有怎样的变化? A:主要是互联网和大厂。现在的原生数据平台还不成熟。 所以,大数据平台原生改造不仅是组件,开发和管理形式也会发生很大的改变。 InfoQ:有没有传统大数据平台原生数据平台的对比案例,可以详细介绍下? A:Snowflake 就是原生数据平台最典型的例子。

    72210编辑于 2022-03-22
  • 原生数据平台:技术指南与腾讯产品方案

    摘要 本文旨在解析原生数据平台的核心价值、挑战,并提供基于腾讯产品的操作指南和增强方案。原生数据平台以其卓越的性能和成本效益,成为企业数据仓库构建的首选。 技术解析 核心价值与典型场景 原生数据平台以其快速、灵活和可扩展的特性,成为现代企业处理大规模数据的首选。 数据安全与合规:随着数据量的增加,确保数据安全和符合法规要求成为一大挑战。 操作指南 数据仓库构建 步骤1:数据导入 使用WeData平台,从异构数据源导入数据。 :某大型零售企业通过WeData平台构建企业级数据仓库,实现了数据的规范化生产和高效应用,根据客户反馈,数据处理效率提升50%,成本降低30%。 通过本文的技术指南和解决方案推荐,企业可以更好地理解和应用原生数据平台,利用腾讯产品实现数据仓库构建和数据资产治理的优化。

    38210编辑于 2025-07-28
  • 原生数据平台(cloudeon)--核心服务组件扩展

    AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。 官方手册:https://www.yuque.com/aolingdata/product ✨AllData正式环境:http://43.138.156.44:5173/ui_moat 摘要:本文聚焦于原生数据平台 Cloudeon),详细阐述了其核心服务组件的扩展情况,具体涵盖以下新增服务: • 添加ZooKeeper服务 • 添加HDFS服务 • 添加FIink服务 • 添加YARN服务 • 添加doris服务 原生数据平台基于开源项目 CloudEon建设 基于开源项目CloudEon建设,简化kubernetes上大数据集群的运维管理,一款基于kubernetes的开源大数据平台,旨在为用户提供一种简单、高效、可扩展的大数据解决方案 CloudEon 将基于 Kubernetes 的资源安装部署开源大数据组件,实现开源大数据平台的容器化运行,您可减少对于底层资源的运维关注。

    28510编辑于 2025-11-15
  • 来自专栏深度学习与python

    传统大数据平台如何进行原生化改造

    那么,高速发展的原生技术能不能解决传统大数据平台的问题呢?答案是肯定的。本文将从大数据平台产品原生化的实践过程,阐述一下传统大数据平台迁移到 Kubernetes 上所要经过的技术改造过程。 ,而原生数据平台恰恰是解决这些问题的良药,简单的讲,就是原生赋予了大数据平台原来没有的多种化能力。 3 传统平台原生化需要解决的 8 项技术难题 虽然大数据平台原生化已经是大势所趋,但在落地实践的过程中还是有一些技术难题需求攻克。 开发者可以基于这个项目部署一个实验的大数据集群,来体验原生数据平台4 结束语 这两年以来,我们在大数据平台原生化这个方向做了大量尝试,实现了大数据组件在 K8s 的稳定运行以及统一的数据安全机制,使数据应用开发平台实现了完整的原生化。

    1.5K50编辑于 2023-03-29
  • 来自专栏腾讯云原生团队

    初探原生私有化容器平台

    计算逐渐成为传统行业 IT 基础架构的选择时,应用向原生迁移成为企业数字化转型的利器,利用 Docker、Kubernetes 、Service Mesh等项目构建私有或混合原生平台正在成为业界的主流选择 容器平台 ? 作为原生架构的重要载体,容器的易用性和可用性需要得到足够的保障,原生的 Kubernetes 虽然可以做到生产级别的业务保障,但作为一个业务平台来使用还是显得太单薄。 不过幸好,在原生迅猛发展的今天,各大厂商都投入了大量的精力建设容器平台,我们无需重复建设,有很多种现成的方案可以选择: 公有容器平台 对于可以把业务放在公有的用户,直接使用厂商提供的服务是最佳选择 私有部署在企业防火墙内,数据放置于本地数据中心,可以极大的保障安全性问题。银行、政企、金融这种对安全监管有要求的行业也会选择私有容器平台来部署他们的服务。 使用 Service Mesh 等原生技术也可以方便地将混合容器平台管理的服务打通,在保证安全的同时提供混合场景下服务级别的通信与治理能力,将混合容器平台打造成一个真正的原生平台

    9.4K41发布于 2020-02-14
  • 来自专栏Rainbond开源「容器云平台」

    如何建设私有原生 Serverless 平台

    随着计算的普及,越来越多的企业开始将业务应用迁移到上。然而,如何构建一套完整的原生 Serverless 平台,依然是一个需要考虑的问题。 随着 PaaS 的出现,计算提供商开始提供更高层次的服务,包括开发框架、数据库、消息队列等,用户只需要关注应用开发,无需关心底层设施。 首先,相比于公共平台,私有化的原生 Serverless 平台可以更好地满足企业的特定需求,保障数据的安全性和隐私性,同时也能够更好地管理和控制计算资源的分配和利用。 许多应用运维工作都将由平台来接管,包括定时数据备份、健康检测、故障自愈等。 可观测性中心 可扩展的全方位可观测性能力,提供上至应用组件,下至平台的监控视图。 Rainbond 作为一个开源的原生应用管理平台,能够帮助企业应对建设私有化的原生 Serverless 平台的难点。

    14.1K30编辑于 2023-03-13
  • 来自专栏项目文章

    原生|技术基石】4:速通原生基石-Istio服务网格

    本期文章是介绍原生技术的基石:Istio服务网格,上次的文章中我们已经学习过了Pod的详细介绍,感兴趣的同学可以去看一下,任意门:【原生|实战研发】2:Pod的深入实践与理解 前言:先来聊聊服务网格 正文:原生 Istio服务网格 1、Istio的产生背景 先来了解一下Istio的产生背景,才能更方便我们知道Istio是什么。 支持多平台,可以在许多环境中运行Istio,如k8s、跨上等。 上述的这些功能极大的减少了应用程序代码,以及底层平台和策略的耦合度。 4、Istio的架构 Istio服务网格的架构分为 数据面板 与 控制面板。 数据面板:是由一组智能代理(Envoy)组成,其代理部署模式为边车模式,可以调解和控制服务之间的所有网络通信。 此外,流量管理规则(即通用4层规则和7层HTTP/gRPC路由规则)可以在运行时通过Pilot进行编程。

    74210编辑于 2024-06-07
  • 来自专栏沃趣科技

    Rancher x QFusion RDS:原生数据库管理平台

    原生产品也显著降低了计算的使用门槛,让企业和开发者更加聚焦业务创新。 近日,沃趣科技与业界应用最为广泛的Kubenetes管理平台Rancher达成战略合作,助力原生时代发展。 Rancher开源社区用户可手动添加Rancher官方仓库,获得QFusion RDS原生数据库的服务目录。 QFusion RDS&Rancher QFusion RDS是沃趣科技自主研发的一款专为中小规模数据库场景设计的原生数据库管理平台。 率先打造企业级原生数据库管理平台QFusion,为用户解决多种数据库的跨部署、多云管理难题,助力客户稳步迈向多元混合的数据库新时代。 目前,沃趣科技已拥有行业领先的企业级数据平台,完整构建高性能、备份、容灾、交换、流转等数据库生态闭环,为解决跨部署、多源异构数据流转等重点难题,开启了原生数据库生态领域的全方位探索。

    5.6K30发布于 2021-10-12
  • 来自专栏云资讯小编的专栏

    开放融合的平台构建企业原生应用

    融合的平台趋势和原生需求 鲁为民首先介绍了融合平台技术的需求。 原生应用的设计 首先,从原生应用平台的设计来看,怎么满足原生应用的需求。 原生应用的设计要求 最基本的要求是原生应用“基础设施”和“数据”之间的分离,应用可能有状态、必须持续地保存,很大程度上能够高可用。 数据持久化 需持久化的数据存放在 DB、NFS、或其它共享存储 日志保存至远程 实例发生迁移时,里面的文件不保留 实例定位 Container 与 IaaS 解耦,依赖域名或配置管理 状态管理 平台不提供状态保存管理 鲁为民还介绍了与腾讯一起打造开放的平台,使用腾讯IaaS服务、网络、计算和存储与MopaaS对接,并整合了腾讯服务产品,如移动、数据、通讯、视频、安全等服务接入MopaaS引擎。

    3.3K00发布于 2017-06-09
  • 来自专栏DBA随笔

    原生技术之kubernetes学习笔记(4)

    YAML的语法和JSON语法很像,都是通过key-value形式来组织的,它可以表示list、dict等常用数据类型,它的后缀一般使用".yml",它有如下几个特点: 1、大小写敏感 2、使用缩进表示递进关系 3、缩进不允许使用tab,只允许使用空格 4、缩进的空格数不重要,只要相同层级的元素左侧对齐即可,这一点类似Python语法 5、使用"#"来表示注释 6、key-value结构用{}包围,list结构用 ,它是k8s中的所有资源增删改查的唯一入口,也是集群控制的入口; Scheduler是负责资源调度的进程; Controller Manager是所有资源对象的自动化控制中心; Etcd提供资源对象的数据保存服务

    51020发布于 2021-03-30
  • 来自专栏DBA随笔

    原生技术之docker学习笔记(4)

    // 原生技术之docker学习笔记(4) // 之前的文章中,我们已经说了RUN、FROM、MAINTAINER、EXPOSE等一些DockerFile的相关命令,今天我们来看DockerFile 这个目录可以提供共享数据或者对数据进行持久化的功能,例如: 1、卷可以在容器间共享和重用 2、一个容器不必和其他容器共享卷 3、对卷的修改是立即生效的 4、卷会一直存在,直到没有任何容器需要他 这个功能可以让我们将部分代码或者数据添加到镜像中

    88150发布于 2021-01-27
  • 来自专栏CNCF

    原生联邦学习平台 KubeFATE 原理详解

    Kubernetes 是目前最流行的基础设施平台,大量的实践证明,Kubernetes 很适合作为企业内部运维大规模分布式系统的平台。 根据 Ovum 的统计,截至2019年底,一半的大数据负载都运行在 Kubernetes 之上。我们团队也推荐 Kubernetes 作为运行 FATE 联邦学习集群生产环境的平台。 KubeFATE 主要由 VMware 中国研发中心原生实验室、微众银行、社区用户共同参与开源贡献。 生成job的元数据, 2.执行对应类型的cluster操作, 3.检查操作是否成功, 4.更新job的状态。 命令行和 API 主要有 list, delete, describe 三种操作。 Install:创建Cluster 首先会在数据库建立job的记录,然后创建cluster的记录,接着查看数据库是否有对应版本chart存在(如果不存在则下载对应版本chart存储到数据库),然后调用helm

    1.3K10发布于 2021-02-23
  • 来自专栏云原生社区

    原生架构下的日志平台方案

    原生架构下的日志平台方案 作者简介 Ford, 原生布道师,原生实验室(CloudnativeLab.COM)创始人 专注于计算领域数年,目前主要从事容器平台的建设,推进各类基础设施服务的原生化 一、原生架构下的日志系统特点 伴随公司近年来持续高速增长的业务发展,以及软件架构的微服务化,在水平和垂直双向扩展后线上运行的应用成倍增长。 同时日志系统提供的也不再局限于应用系统的诊断,还包括业务、运营、BI、审计、安全等领域,日志平台最终的目标是实现公司在原生架构下各个方面的数字化、智能化。 2、资源消耗,在原有的传统ELK架构中,基于 JDK 的 Logstash 和 Filebeat 预期分别会消耗500M、12M左右的内存,在微服务、原生的架构下,服务通常都会拆的很小,因此数据采集对于服务自身的资源消耗要尽可能的少 二、原生架构下的日志系统设计 2.1 方案选型 原生架构下的日志采集解决方案 编号 方案

    3K21发布于 2020-12-08
  • 来自专栏CNCF

    构建端到端原生应用平台

    作为一个全功能的平台即服务(PaaS), App Platform 解决了从开发到 Kubernetes 支持的高度可扩展和弹性的原生部署的操作方面的问题,同时保持了尽可能简单的用户体验。 应用类型检测、构建和运行由原生构建包 Cloud Native Buildpacks 处理(最近成为了 CNCF 孵化器项目,祝贺!?)。 在高层次上,它将这个过程分为 4 个阶段: Detection:它决定应用什么构建包。 我们还用额外的元数据来扩展 buildpack 结果,比如检测到的语言/框架、我们认为支持的应用平台组件类型、推荐的构建/运行命令等。 总结 应用平台将所有这些技术结合在一起,消除了大多数应用程序无法达到的复杂性和运营投资,以最小的用户努力提供了一流的原生平台。应用平台是建立在巨人的肩膀上。

    1.3K40发布于 2021-04-21
  • 来自专栏k8s技术圈

    原生可观测平台 OpenObserve 初体验

    OpenObserve 是一个 Rust 开发的开源的高性能原生可观测平台(日志、指标、追踪),比起 Elasticsearch 它大约可以节省 140 倍的存储成本,OpenObserve 能够处理 OpenObserve 不依赖于数据索引,它将未索引的数据以压缩格式存储在本地磁盘或以 parquet 列格式的对象存储中。 ,因为数据不会丢失。 Ingester:Ingester 用于接收摄取请求并将数据转换为 parquet 格式然后存储在对象存储中,它们在将数据传输到对象存储之前将数据临时存储在 WAL 中。 sending event OpenObserve - Starting server [2023-08-04T10:18:07Z INFO actix_server::builder] starting 4

    4K50编辑于 2023-08-21
  • 来自专栏伪架构师

    Karmada: 原生多云容器编排平台

    7月17日,在Cloud Native Days China原生多云多集群专场,华为原生开源负责人王泽锋发表了《Karmada: 原生多云容器编排平台》主题演讲,分享了在原生多云多集群方面的思考与实践 以下为演讲全文 根据最新的调查报告显示,超过93%的企业正同时使用多个厂商的服务。原生技术和市场不断成熟,多云、多集群部署已经成为常态,未来将是编程式多云管理服务的时代。 ? 原生多云多集群的典型阶段 阶段一:一群孤岛 一致的集群运维 一致的应用交付 业务割裂,互不感知 数据孤岛、资源孤岛、流量孤岛 阶段二:威尼斯水城 统一应用交付(部署运维) 统一应用访问(流量分发) 现阶段,原生多云多集群业务的编排也面临着诸多挑战: 1)集群繁多的重复劳动:运维工程师需要应对繁琐的集群配置、不同厂商集群间的管理差异以及碎片化的API访问入口等问题; 2)业务过度分散的维护难题: 4)厂商绑定:业务部署的黏性问题,缺少自动化故障迁移;缺少中立的开源多云容器编排项目。 多集群容器编排的前世今生 ? Karmada:开源的原生多云容器编排平台 ?

    1.6K40发布于 2021-08-12
  • 来自专栏Rainbond开源「容器云平台」

    原生时代的DevOps平台设计之道

    原生时代,我们甚至呼吁开发人员在开发业务系统的时候,应该尽量做到“无状态化”,即在业务系统中,不存在限制实例横向扩容的状态数据,至少做到不同实例之间,数据可以共享。 易于掌控的微服务架构微服务架构也是原生平台不可缺少的一个元素。 原生应用平台,则为开发人员更简单的入手微服务框架提供了可能。原生平台首选的微服务框架,应该是以 Istio、Linkerd 为代表的 Service Mesh 微服务框架, 也被称为“服务网格”。 原生平台本身作为开发人员的基础设施,也需要被持续的维护。如何优化运维人员的管理体验,也是在原生平台设计过程中的重点。 从这个角度来说,Rancher 的定位应该位于 PaaS 与原生平台之间。KubeSphere 和 Rainbond 都属于以应用为中心的原生平台产品,二者的设计思路不同之处见仁见智。

    1.6K41编辑于 2022-10-14
  • 来自专栏CNCF

    原生AI平台的加速与实践

    : ---- 前言:12月19日,在 Cloud Native Days China -原生AI大数据专场,腾讯技术事业群高级工程师薛磊发表了《原生AI平台的加速与实践》主题演讲。 ? 演讲主要包含五部分的内容: Kubernetes介绍 AI离线计算 AI场景下Kubernetes的不足 Kubeflow 星辰算力平台的架构 Kubernetes介绍 K8s是生产级的容器编排系统,它也是原生应用最佳的一个平台 支持所有流行语言,如 Python、C++、Java、R和Go 可以在多种平台上工作,甚至是移动平台和分布式平台 2)PyTorch PyTorch是一个开源的Python机器学习库,基于Torch, 将单机变成多机,分布式训练提高训练速度 拆分数据集 典型的分布式AI计算的架构: TensorFlow PS-Worker Horovod 两种方式的异同: 1)分布式AI计算框架:TensorFlow 提供TensorFlow原生PS-worker架构 的多机训练 推荐将PS和worker一起启动 通过service做服务发现 在社区中最早期的Operator 星辰算力平台的架构 它为私有的一个离线计算平台

    2.6K31发布于 2021-01-27
  • 原生PaaS服务平台-对象模型思考

    在前面谈原生技术解决方案和PaaS平台的时候,更多都是从技术平台层面进行阐述,如果真在要转变为面向多租户的PaaS服务平台,那么就需要一个完整的底层对象模型支撑。 一个应用本身有可以分解为多个微服务模块,实际上在原生PaaS平台下,最终进行持续集成,部署交付的都是微服务模块。每个微服务都独立进行构建和部署交付。多个微服务模块构成一个完整的大应用系统。 PaaS平台多租户模型 上图为Gartner的多租户参考架构 在私有云和公用环境对多租户的理解上是有不同的概念的。 在公用环境往往我们谈的是saas的多租户,租户往往为使用业务系统的一个企业或组织,而在私有环境,paas平台提供的应用往往为平台级应用,平台级应用面对的租户是业务系统本身。 在公用下的多租户,如果采用完全共享的模式,还必须考虑数据库的可扩展性,多租户架构服务提供独立数据库、扩展表和大表(保留字段)三种多租户架构,开发者可以通过API创建和管理多租户架构。

    51810编辑于 2025-06-24
  • 来自专栏【腾讯云开发者】

    原生数据湖101

    核心差异就在于原生技术的普及和落地。具体到数据平台差异的核心就是原生数据湖架构极大的降低了企业的上成本,可以达到比 Local 更低的 IT 成本,同时享受公有的各种好处。 1. 如何避免直接迁移 local 大数据架构到上带来的问题,充分利用公有特性,正确的搭建/使用原生数据平台,提炼出了原生数据湖架构,是我们研究的重点。 Spot 价格通常能到三折甚至一折,如何充分利用 Spot 计算资源,又不至于被回收导致任务失败是原生数据平台的一大挑战。 同时集群扩容如何满足波动性很大的大数据计算需求也是一个评价原生数据平台性能的重要指标。 腾讯数据湖产品 要解决数据湖架构三大原则中的诸多问题,从 0 打造原生数据湖,需要很多专业的公有背景和数据湖技术能力,腾讯为此推出两款数据湖产品,便于客户数据平台架构升级。

    88910发布于 2021-03-11
领券