首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏存储内核技术交流

    Lustre分布式存储系统架构

    Lustre系统架构 系统组件描述 系统组件联系

    1.2K10编辑于 2023-02-26
  • 来自专栏菜鸟成长学习笔记

    分布式日志存储架构代码实践

    上一篇,我们针对分布式日志存储方案设计做了一个理论上的分析与总结,文章地址[1]。本文我们将结合其中的一种方案进行实战代码的演示。 另外一种方案,将在下一篇文章进行分享,此篇文章分享的是MongoDB架构模式。在知乎上发布该文章时,有人提到使用opentelemtry+tsdb[2],感兴趣的可以去了解一下。 架构模式 通过上一篇的分析,我们大致总结出这样的一个架构设计,架构图如下: 1. 业务A、业务B、业务C和业务D表示我们实际的接口地址。当客户端发送请求时,直接的处理模块。 2. MQ服务,则是作为日志队列,临时存储日志消息。这样是为了提高日志的处理能力。在高并发的业务场景中,如果实时的将日志写入到MongoDB中,这样难免会降低业务处理的速度。 3. 整理代码架构如下: 代码说明 下面罗列几个使用到的技术栈以及对应的版本,可能需要在使用本代码时,需要注意一下这些服务的版本兼容,避免代码无法运行。 1. Go version 1.16。 2.

    74320编辑于 2022-06-08
  • Kafka核心架构分布式存储

    二、分布式存储基石:HDFS架构深度剖析要理解现代中间件的数据分布逻辑,必须先解剖大数据存储基石HDFS的底层架构。 此架构完美平衡了跨机架的网络传输开销与整个机架断电的灾备风险。三、Kafka物理架构与副本放置Kafka深度继承并改良了分布式存储架构基因。在逻辑层,业务数据被分类为Topic主题。 :主从与对等在分布式系统理论中,节点权力的架构分配存在两种截然不同的流派。 HDFS集群架构属于经典的Master-Slave模型,这种模型最大的架构级风险是什么?Kafka的Broker集群在承接外部并发流量时,体现了哪种分布式架构思想? 七、解析题1解析答案:分布式事件流平台。详解:集流数据传输、存储和解耦于一体,是实时计算的核心数据枢纽。题2解析答案:页缓存(PageCache)。

    38211编辑于 2026-03-05
  • 利用YashanDB实现企业数据分布式存储架构

    随着企业数据规模的爆发式增长,如何构建高效且稳定的分布式存储架构成为关键问题。传统单机数据库难以满足海量数据的存储和高并发访问需求。 本文将基于YashanDB数据库系统,深入解析其分布式架构设计和核心技术,阐述如何构建高效的企业级分布式存储方案,以满足复杂业务场景的需求。 分布式部署分布式部署基于Shared-Nothing架构,增加了管理节点(MN)、协调节点(CN)和数据节点(DN)三类角色,分别负责元数据管理、SQL解析与分发以及数据持久化。 结论随着企业数据规模不断扩大,实现高性能、高可用且安全的分布式存储架构成为必然趋势。 未来,随着数据分析需求和实时处理能力的不断提升,基于YashanDB构建的分布式存储架构将持续发挥核心竞争力,推动企业数字化转型升级。

    28010编辑于 2025-09-11
  • 深度剖析:Ceph分布式存储系统架构

    一文带你彻底搞懂Ceph的架构奥秘,从小白到架构师的进阶之路! 文章目录 1. Ceph简介:存储界的"多面手" 什么是Ceph? 为什么选择Ceph? 2. 成本友好:基于标准硬件,不需要购买昂贵的专用存储设备。 2. 核心组件架构:四大金刚的分工合作 Ceph的架构就像一个精密的交响乐团,每个组件都有自己的职责,但又完美协调。 支持StatefulSet持久化 容器镜像存储 大数据平台 Hadoop生态: HDFS的替代方案 支持MapReduce作业 Spark数据湖存储 总结 Ceph作为新一代分布式存储系统,凭借其统一架构 核心优势回顾: ✅ 统一存储:一套系统提供三种存储服务 ✅ 线性扩展:从TB到PB级别无缝扩展 ✅ 高可靠性:多副本机制保证数据安全 ✅ 无单点故障:分布式架构避免性能瓶颈 ✅ 开源免费:降低存储总拥有成本 关键词:Ceph架构分布式存储、CRUSH算法、高可用、性能优化、云存储

    5.8K12编辑于 2025-07-15
  • 来自专栏架构师专栏

    深度剖析:Ceph分布式存储系统架构

    一文带你彻底搞懂Ceph的架构奥秘,从小白到架构师的进阶之路! 文章目录1. Ceph简介:存储界的”多面手”什么是Ceph?为什么选择Ceph?2. Ceph,这个名字听起来像是某种神秘的海洋生物(实际上确实来源于头足类动物),但它其实是一个统一的分布式存储系统。就像一个超级变形金刚,它能同时提供对象存储、块存储和文件存储三种服务。 成本友好:基于标准硬件,不需要购买昂贵的专用存储设备。2. 核心组件架构:四大金刚的分工合作Ceph的架构就像一个精密的交响乐团,每个组件都有自己的职责,但又完美协调。 核心优势回顾: ✅ 统一存储:一套系统提供三种存储服务✅ 线性扩展:从TB到PB级别无缝扩展✅ 高可靠性:多副本机制保证数据安全✅ 无单点故障:分布式架构避免性能瓶颈✅ 开源免费:降低存储总拥有成本在这个数据爆炸的时代 关键词:Ceph架构分布式存储、CRUSH算法、高可用、性能优化、云存储

    1.8K10编辑于 2025-07-10
  • YashanDB分布式存储架构的设计精髓解读

    YashanDB 是一种分布式存储系统,设计精髓通常体现在以下几个关键方面:1. 分布式架构:YashanDB 采用分布式架构,将数据分散存储在多个节点上,增强了系统的可伸缩性和容错能力。 2. 数据一致性:在分布式环境中,保持数据一致性是一个重要挑战。YashanDB 可能采用强一致性或最终一致性的保证,确保在多副本情况下,数据的一致性和可用性。3. 数据分片:为提高存储和查询效率,YashanDB 支持数据分片,将数据划分为不同的逻辑部分,这样可以在多个节点之间平行处理请求。6. 多数据模型支持:YashanDB 可能支持多种数据模型(如键值存储、文档存储、图存储等),以适应不同应用的需求。 通过上述设计精髓,YashanDB 努力在大规模分布式系统中提供高效、可靠和灵活的数据存储解决方案。对于具体的实现细节和技术特性,可以参考官方文档或相关论文以获得更深入的理解。

    15510编辑于 2025-11-17
  • 来自专栏肉眼品世界

    Ceph分布式存储系统架构研究综述

    当时他发现元数据的查询和维护严重影响了 Lustre等分布式文件系统的性能和扩展性,因此设计了一种利用算法来确定数据与存储节点对应关系的方法 CRUSH。 Ceph存储系统的设计目标是提供高性能、高可扩展性、 高可用的分布式存储服务。 本文介绍Ceph 的集群架构、数据放置方法以及数据读写路径,并在此基础上分析其性能特点和瓶颈。 集群架构 RADOS可提供高可靠、高性能和全分布式的对象存储 服务。 在分布式存储系统中,数据被分散在大量的存储服务器上,大部分分布式存储系统都直接使用本地文件系统来存储 数据,如HDFS,Lustre等。 )本地文件系统不支持对象的事务操作。FileStore为了支持写事务的特性,通过写前日志功能来保证事务的原子性。这导致了数据“双写”的问题,造成了一半磁盘性能的浪费。

    1.1K20发布于 2021-07-13
  • YashanDB的分布式存储架构详解与优化

    YashanDB 是一种分布式数据库,通常具有高吞吐量和低延迟的特点。以下是 YashanDB 的分布式存储架构详解及其优化策略:1. YashanDB 的基本架构1.1. 存储层- 数据分片:YashanDB 将数据分片以提高并行处理能力和存储效率,每个节点存储特定的数据段。- 副本机制:通过数据副本保障数据的高可用性,通常采用主从复制或多主复制的模型。1.2. - 计算节点:支持分布式计算,多个节点共同完成计算任务,分散负载。1.3. 元数据管理- 元数据服务:管理数据的元信息,包括分片策略、节点状态、数据路由等,通常需要高可用和一致性。2. 在实际应用中,团队会结合具体业务需求,灵活调整 YashanDB 的架构和优化策略,以确保系统的可靠性和高性能。 结论YashanDB 作为一种分布式存储解决方案,通过合理的架构设计与优化策略,能够有效地满足现代分布式系统对高可用性、高性能的需求。在具体应用中,结合实际情况进行优化,将进一步提升其性能和稳定性。

    18710编辑于 2025-11-16
  • YashanDB分布式存储架构解析及优化建议

    因此,深入了解YashanDB的分布式存储架构及其优化方法至关重要。分布式架构概述YashanDB架构特色YashanDB是一款兼具可扩展性、高可用性及高性能的分布式数据库。 其分布式架构主要由以下模块构成:主节点(MN):负责元数据管理、事务管理以及服务调度。协调节点(CN):负责接收用户请求,生成查询计划,并向数据节点分发查询任务。 分布式存储的优势高可用性YashanDB通过主备复制机制,例如主库和备库之间的实时数据同步,确保在故障发生时能够迅速切换,最大限度降低数据丢失风险。 高扩展性分布式架构允许随着数据量的增加灵活增加节点,通过增加硬件资源实现线性扩展。YashanDB的设计能够支持海量数据的高效访问和存储,带来可观的性能提升。 结论YashanDB提供了一种高效、可靠的分布式存储架构,具备出色的可扩展性和高可用性特点。

    21710编辑于 2025-08-19
  • 来自专栏菜鸟成长学习笔记

    分布式日志存储架构设计方案

    本文是分布式日志存储系列的理论篇。也有实战篇,将会分享从0到1的整个过程,从0环境的搭建到真正的实践落地。 分布式部署(文件) 这里的分布式部署(文件)指的是,系统服务采用分布式部署时,日志存储还是采用文件存储。大致的逻辑图如下: 优点 这样的部署方案有什么好处,和上面提到的单节点部署一样。 缺点 在分布式部署中,还是同样的会遇到单节点部署所遇到的问题。 不便于系统排查。当系统出现异常时,由于是分布式部署,我们不知道最终的日志存储在那一台服务器上,就需要挨个服务器的排查。 分布式部署(日志系统) 上面提到了分布式系统,使用文件存储日志的几个弊端。因此这里推出使用独立的日志系统,存储系统日志。 ELK存储 ELK是Elasticsearch+Logstash +Kibana 这种架构的简写。这是一种开源日志分析平台的架构。ELK是开源的,社区活跃,用户众多,这样的架构也得到广泛的使用。

    1.5K11编辑于 2022-06-08
  • 来自专栏罗西的思考

    Dynomite 分布式存储引擎 之 DynoJedisClient(2)

    [源码分析] Dynomite 分布式存储引擎 之 DynoJedisClient(2) 0x00 摘要 上文我们介绍了 NetFlix Dynomite 客户端 DynoJedisClient 的 4.1.1 策略分类 Java驱动程序提供了几个RetryPolicy实现: RetryNTimes:保证一个操作可以被重试最多 N times,RetryNTimes (2) 意味着在放弃之前,最多 2 + 1 = 3 重试; RunOnce:从不建议重试,始终建议重新抛出异常; 4.1.2 策略使用 具体在执行命令时,我们可以看到,驱动会透明的尝试其他节点并在后台调度重新连接死亡节点: 获取重试策略 : Pool 2]| | | | | +------------ 如何监控底层机架状态; 我们接下来引出 基于 DynoJedisClient 的 分布式延迟队列 Dyno-queues ,看看它是如何实现的。

    1.1K10发布于 2021-03-02
  • 来自专栏曾楚伟的专栏

    微信 PaxosStore:大规模分布式存储架构

    主要分享内容: PaxosStore设计; 基于PaxosStore的存储案例。

    3.2K00发布于 2017-06-16
  • 来自专栏小白晋级大师

    分布式系统架构2:服务发现

    1.概念服务发现指的是分布式系统中,服务实例动态注册自己的信息到注册中心,其他服务能发现这些实例的位置,实现服务间通信。为什么需要服务发现?对于分布式应用来说,服务发现不是可选项,而是必须的。 2.组成由注册中心和消费者组成注册中心Service Registry:服务实例将自己的元数据(IP、端口、健康状态等)注册到注册中心。 本身需要具备高可用性,通常通过分布式一致性协议(如Raft、Paxos)来保证数据的一致性和可靠性。比如:Netflix Eureka,它提供了一个用于注册和查询服务实例的 REST API。 适用场景:微服务架构中,服务实例与注册中心直接交互示例:Eureka:Spring Cloud中,服务通过 @EnableEurekaClient 注解实现主动注册。

    44210编辑于 2024-12-16
  • 来自专栏NoSQL数据库

    【赵渝强老师】MongoDB的分布式存储架构

    MongoDB为了解决这一系列的问题提出了将数据分割存储在多台服务器上,使得数据库系统能存储和处理更多的数据,以实现数据的分布式存储。这就是MongoDB的分片。 因此复制集从本质上并不能解决数据海量存储的问题。一、 MongoDB分片的架构MongoDB分片的架构需要依赖MongoDB的复制集为基础来实现,下图展示了分片的体系架构。 视频讲解如下:二、 【实战】部署MongoDB分片在了解到了MongoDB分片的架构与组成以后,下表列举了MongoDB分片中的各个节点信息。提示:表中列举的的信息是MongoDB分片架构的最简信息。 > sh.shardCollection("myshardDB.table1",{"_id":1})提示:这里使用了插入文档的_id作为片键来实现文档的分布式存储。 因此可以得出结论,数据实现了分布式存储但效果不是很好。为了实现更好的数据分布式存储应当合理地选择片键。

    20710编辑于 2025-10-02
  • 来自专栏罗西的思考

    并行分布式框架 Celery 之架构 (2)

    [源码解析] 并行分布式框架 Celery 之架构 (2) 0x00 摘要 Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的异步任务队列,同时也支持任务调度。 本文是系列第二篇,继续探究 Celery 架构。 0x01 上文回顾 前面我们用几篇文章分析了 Kombu,为 Celery 的分析打下了基础。 上文 [源码解析] 并行分布式框架 Celery 之架构 (1) 中,我们大致介绍了 Celery 的概念,用途和架构,现在回忆 Celery 的架构图如下: +-----------+ Celery 默认的存储是通过 Python 默认的 shelve 库实现的,shelve 是一个类似于字典对象的数据库,我们可以通过调用 sync 命令在磁盘和内存中同步数据。 对于 Consumer 来说, 1 是基本功能,这些功能组成了一个简单的非强壮的消息队列框架; 2 一般重要,可以实现一个高级一点的功能; 3 属于附加功能,同时也属于一点分布式的功能。

    1.2K10发布于 2021-04-01
  • 来自专栏【腾讯云开发者】

    一文读懂分布式存储架构背后的存储引擎原理

    数据库(数据引擎)最核心的任务就是“读到写入的值”,我们尝试从“最简单的脚本文件数据读写”一步一步扩展讨论到“分布式键值数据库”,在这个过程中我们会遇到很多“挑战”,并尝试逐步解决。 01、单机存储引擎 从两行代码的shell脚本读写文件开始,我们通过逐步解决如下问题得到了一个单机可用的存储引擎(LSM Tree) 1. 读取慢 2. 磁盘耗尽 3. 文件压缩合并 4. 此时架构如下: 此时还有一个问题就是:数据初始是写入到memtable中的,若还没来得及dump到文件中,发生了机器故障,重启之后内存丢失,memtable中写入的值也会丢失。 3.1.1 基于关键字区间分片 如上图,我们按照“键”的区间来分区,字典序介于Bayey - Ceanothus的存储到分片2, 介于Trudeau - Zywiec的存储在12号分片;为避免数据倾斜, Proxy通过watch感知到节点变化之后会将后续请求转发到正确的节点; 关键字区间会映射到不同的分区,多个分区会映射到同一个节点中,图例中仅展示了主节点; 经过上面所有的讨论,我们可以得到如下这个相对通用的分布式存储架构

    1.1K21编辑于 2024-12-05
  • 来自专栏明明如月的技术专栏

    软考高级架构师:Redis 分布式存储方案

    Redis 是一个高性能的键值存储系统,经常被用于缓存和会话管理等场景。在分布式存储方面,Redis 提供了多种解决方案,主要包括主从模式、哨兵模式和集群模式。 一、主从模式 主从模式(Master-Slave)是 Redis 最简单的一种分布式架构。在这种模式下,有一个主节点(Master)和一个或多个从节点(Slave)。 三、集群模式 集群模式(Cluster)是 Redis 提供的一种更复杂、更强大的分布式解决方案,适用于大规模数据和高并发场景。 原理: 数据分片(Sharding):将数据分布到多个节点上,每个节点只存储一部分数据。 每个节点既可以是主节点也可以有对应的从节点,从而形成一个集群。 根据不同的需求和场景选择合适的 Redis 分布式存储方案,可以更好地发挥 Redis 的性能和优势。

    94701编辑于 2024-05-25
  • 来自专栏波波烤鸭

    2-1 分布式文件存储系统Ceph

    分布式文件存储系统Ceph 1 分布式文件存储系统Ceph  Ceph是一个统一的分布式存储系统,设计初衷是提供较好的性能、可靠性和可扩展性。 中文学习网:http://docs.ceph.org.cn/ Ceph架构: ? OSD:RADOS中的存储节点被称为OSD 架构图讲解: 1:文件上传,先将文件切片成N个object(如果开启了cephFS,可以使用MDS缓存) 2:切片后的文件object会存入到Ceph中 3: 文件存储前,会经过CRUSH算法,计算当前文件存储归结于哪个PG 4:PG是逻辑概念上对文件存储范围划分的索引 5:根据PG索引将文件存储到指定服务器的OSD中 1.2 Ceph集群搭建 ? ​ python2-pip安装即可。

    2.9K10发布于 2021-01-14
  • 来自专栏明志德到的IT笔记

    分布式存储

    分布式存储 分布式存储的思想是什么 分布式存储的思想是将数据分散存储在多个节点上,以提高数据的可靠性、可扩展性和性能。 除了上述常见的RAID级别外,还有其他一些RAID级别,如RAID 2、RAID 3、RAID 4、RAID 7等。每种级别都有其特定的优点和适用场景。 这三个组成元素共同协作,构成了分布式存储系统的基本架构。数据的使用者通过与数据的索引者进行交互来获取所需的数据位置信息,然后与数据的存储者进行通信,读取或写入实际的数据。 在实施过程中,需要考虑数据一致性、查询性能、数据迁移等方面的问题,并选择合适的工具和技术来支持分布式数据库架构分布式数据库主从复制:读写分离的架构设计、数据复制(同步数据复制、异步数据复制)、主库挂掉后方案 分布式数据库中的主从复制是一种常见的架构设计,它通过将写操作集中在主数据库上,并将数据的副本复制到一个或多个从数据库上来提高系统的性能

    2K10编辑于 2023-12-18
领券