搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏大数据与微服务架构
千亿级海量数据库OceanBase
OceanBase是阿里集团研发的可扩展性关系型数据库，实现了数千亿条记录、数百TB数据上的跨行跨表事务。 OceanBase的目标是支持数百TB的数据量以及数十万TPS、数百万QPS的访问量。一、OceanBase系统架构： 1、客户端：使用OceanBase的方式与MySQL完全相同，支持JDBC、C客户端访问，基于MySQL数据库开发的应用可以直接迁移至OceanBase。 3、UpdateServer：存储OceanBase系统的增量更新数据，一般为一主一备，主备之间可采用不同的同步模式。三、OceanBase扩展 OceanBase融合了分布式存储系统和关系型数据库这两种技术，UpdateServer相当于一个高性能内存数据库，底层采用关系型数据库技术实现，ChunkServer相当于一个分布式文件存储系统四、存储介质对比类别每秒读写（IOPS）次数每GB价格（元）随机读取随机写入内存千万级 150 友好友好 SSD盘 35000 20 友好写入放大问题 SAS磁盘 180 3 磁盘寻道
2.7K10发布于 2020-04-11
来自专栏Eliauk的小窝
项目如何适配国产海量数据库
postgresql即可注意：postgresql的驱动类是：org.postgresql.Driver 要注意的是：postgresql的url中需要指定currentSchema=xxxx 这是一个默认访问的数据库
1.2K10编辑于 2024-03-16
YashanDB数据库海量数据存储方案解析
在现代的数据库应用中，如何有效存储与管理海量数据，一直是技术发展与应用实践中的重大挑战。面对不断增长的数据量，传统数据库的存储方案往往难以满足高效性、扩展性和可靠性的需求。因此，合理的海量数据存储方案显得尤为重要。本文将重点讨论YashanDB的各类存储方案与技术架构，帮助读者理解其背后的原理与优势。适合高并发、海量数据分析等应用场景。共享集群部署共享集群通过共享存储，所有实例均可读写，提高了数据访问的效率。该模式通常用于对高可用、高性能以及可扩展性都有较高要求的场景。 YashanDB数据库将数据组织成不同的逻辑结构，以应对不同的业务需求。段页式存储管理YashanDB在段的管理能力上，可将数据库对象划分为多个段，段根据不同的存储需求可以被细分。结论YashanDB提供了多样化的海量数据存储解决方案，结合先进的存储架构、逻辑管理、并发控制与高可用机制，能够高效支撑不同规模业务场景下对数据的存储与管理需求。
16900编辑于 2025-07-06
来自专栏腾讯云数据库(TencentDB)
腾讯云数据库海量数据交互之道
TDSQL-A是在腾讯业务场景下诞生的在线分布型OLAP数据库系统，在处理海量数据分析业务的过程中持续对产品构架进行升级调整，是PG生态中分析型MPP产品的又一力作。本文将由腾讯云数据库专家工程师伍鑫老师为大家详细介绍TDSQL-A的发展历程、技术架构和创新实践，以下为分享实录： TDSQL-A发展历程 TDSQL-A是一款基于PostgreSQL自主研发的分布式在线关系型数据库 是一个面向海量数据实时在线分析产品，采用无共享MPP构架。面向分析型场景的极致性能优化，我们自研了列式存储，同时也支持行列混合存储模式。介绍一下列存储延迟扫描优化，例如有一个查询，在同一张表上有多个Predicate条件，比如10列有3列带有Predicate。﹀﹀﹀ -- 更多精彩 -- 揭秘TDSQL-A：兼容Oracle的同时支持海量数据交互十问十答，带你全面了解TDSQL-A核心优势 ↓↓点击阅读原文，了解更多优惠
2.3K30编辑于 2022-02-15
来自专栏萝卜大杂烩
海量数据，3行Python代码直接获取！
item number 0 总貌上市公司/家 1638 1 总貌总股本/亿股 41496.51 2 总貌总市值/亿元 366954.33 3 流通市值/亿元 302693.06 0 主板上市公司/家 1526 1 主板总股本/亿股 41119.88 2 主板总市值/亿元 348962.46 3 流通市值/亿元 299784.63 0 科创板上市公司/家 112 1 科创板总股本/亿股 376.63 2 科创板总市值/亿元 17991.87 3 NaN NaN NaN NaN 3 187104 4.74 0.260000 0.40 ... 一点就到家 426.22 11.95 17 24281.57 3 4 夺冠 420.24 11.79 26 77728.87 4 5 姜子牙
1.1K10发布于 2021-01-12
来自专栏用户6291251的专栏
什么，3行Python代码就能获取海量数据？
gp.weibo_index(word="马保国", time_type="1month") print(df_index) time_type="1month"; 1hour, 1day, 1month, 3month
1.1K20发布于 2020-12-16
来自专栏数据森麟
海量数据，3行Python代码直接获取！
item number 0 总貌上市公司/家 1638 1 总貌总股本/亿股 41496.51 2 总貌总市值/亿元 366954.33 3 流通市值/亿元 302693.06 0 主板上市公司/家 1526 1 主板总股本/亿股 41119.88 2 主板总市值/亿元 348962.46 3 流通市值/亿元 299784.63 0 科创板上市公司/家 112 1 科创板总股本/亿股 376.63 2 科创板总市值/亿元 17991.87 3 NaN NaN NaN NaN 3 187104 4.74 0.260000 0.40 ... 一点就到家 426.22 11.95 17 24281.57 3 4 夺冠 420.24 11.79 26 77728.87 4 5 姜子牙
1.5K10发布于 2021-01-25
来自专栏JavaQ
支撑海量数据的数据库架构如何设计？
如果你运气不太好，数据库服务器的配置不是特别的高的话，弄不好你还会经历数据库宕机的情况，因为负载太高对数据库压力太大了。那么百万并发的数据库架构如何设计呢？多数都是分库分表加主从吧？分库分表说白了就是大量分表来保证海量数据下的查询性能。在写入数据的时候，需要做两次路由，先对订单 id hash 后对数据库的数量取模，可以路由到一台数据库上，然后再对那台数据库上的表数量取模，就可以路由到数据库上的一个表里了。 10 bit 作为工作机器 id，12 bit 作为序列号 *
* @version: v1.0.0 * @author: BianPeng * @date: 2019年4月11日下午3: /** case3: 多线程-测试多个生产者同时生产N个id, 全部id在全局范围内是否会重复?
1.4K20发布于 2019-06-02
来自专栏小工匠聊架构
Oracle海量数据优化-02分区在海量数据库中的应用-更新中
---- 概述以前梳理了一篇文章，案例不是很充分 Oracle-分区表解读故本篇博文系统的再重新阐述一下当我们对海量数据的Oracle数据库进行管理和维护时，几乎无一例外的使用了分区（partition 分区是Oracle数据库中对海量数据存储管理提供的一个应用很广泛的技术，它可以非常方便的加载数据、删除数据和移动数据，特别是对于一个拥有海量数据的OLAP及数据仓库系统的数据库来说，更是如此。有一个分区裁剪功能，只对需要处理的分区进行扫描，这样扫描的数据块会大大的减少，使查询效率提高分区更利于数据维护，可以只对单独分区进行备份、恢复，这样就可以大大的缩短数据备份、恢复的时间分区有利于数据库数据的过期化处理
2.1K20发布于 2021-08-16
来自专栏Cloud Native - 产品级敏捷
海量数据, 为何总是海量垃圾 ?!
2017.9.10, 深圳, Ken Fang 雷军说：我拥有海量的数据, 却不知道怎么用？每年, 花在存储海量数据的费用, 也是海量；足以使企业破产⋯ 为何会如此？当我们将所谓 “海量数据分析” 的神秘面纱给揭开时, 打破 “海量数据分析” 的神话, 就会很容易的明白, 真正的问题到底出在哪？为何谷歌能做到的, 我们却做不到？大家都明白的 Common Sense: 做海量数据分析, 要先能建立数据模型；有了数据模型, 我们才能从 “海量” 数据中, 去提炼出 “有用” 的数据。海量数据分析最关键、最重要的ㄧ步：将海量数据 “转换” 为有用的数据。而数据模型建立的前提是： @ 要能先分析出, 产生数据背后的 “用户的目的” 。例如：用户是基于什么样的社会事件？天灾？这样的数据, 再如何的 “海量”, 也根本没法经由 “数据分析师”, 使用任何的数据分析工具, 建立出任何有效的数据模型；海量数据将永远没办法转换为有用的数据。为什么谷歌能做得到？
1.6K50发布于 2018-01-05
如何在YashanDB数据库中高效处理海量数据
在现代数据库技术中，海量数据的管理和处理成为了一个普遍存在的挑战。随着数据规模的不断扩大，性能瓶颈、数据一致性问题以及易用性需求等问题日益凸显。 YashanDB作为一款专为处理海量数据而设计的数据库，凭借其高可扩展性、高并发性能和高可用性，提供了一系列技术手段以应对这些挑战。本文旨在探讨如何在YashanDB中高效地管理和处理海量数据，目标读者为数据库管理员、数据工程师及相关技术人员。 3. 事务控制与ACID特性YashanDB支持ACID（原子性、一致性、隔离性、持久性）特性，确保在处理海量数据时，各个事务能够保持数据的完整性和一致性。定期监控数据库性能，分析慢查询，优化执行计划，确保海量数据高效处理。启用数据加密保护机制，加强数据安全，防止数据泄露风险。
19600编辑于 2025-07-18
来自专栏算法研习社
海量数据面试题总结(3)-多层桶划分
本系列文章对海量数据面试题进行了归类和总结，给出海量数据处理问题的通用解决思路，后面附有例题，希望大家能够举一反三。往期回顾：海量数据面试题总结(1)-Hash映射+Hash统计+归并排序海量数据面试题总结(2)-BitMap 模式三：多层桶划分一、解决思路：多层桶划分，本质思想还是分而治之，可以认为是BitMap (2) 实际上，如果不是int16而是int64，2^64个Bit在内存中是存不下的，但可以经过3次划分降低到可以计算的程度。
68620发布于 2020-07-20
YashanDB数据库如何保障海量数据安全与隐私
在现代信息技术迅猛发展的时代，数据库管理系统面临着数据安全与隐私保护的重大挑战。随着企业集成越来越多的海量数据，确保这些数据在存储、传输及访问过程中的安全性和隐私保护变得尤为重要。 YashanDB作为一个高性能、高可用的数据库系统，实施了多种措施以保障数据安全与隐私内容。 3. 完整性约束与审计日志YashanDB通过数据完整性约束（如主键约束、外键约束、检查约束等）确保保存数据的一致性和有效性，防止数据被非授权修改。定期执行数据库备份并测试恢复过程，确保在紧急情况下数据能够快速恢复。结论YashanDB通过加密、访问控制、完整性约束、多版本控制和高可用性等技术手段，有效保障了海量数据的安全与隐私。在实际应用中，应结合行业最佳实践，对数据库安全策略进行定期评审和调整，以适应不断变化的安全环境。
23110编辑于 2025-07-05
YashanDB数据库如何帮助企业应对海量数据挑战
传统数据库系统在面对多样化的数据类型和复杂的业务场景时，性能瓶颈和管理复杂性逐渐显现。 YashanDB作为一款先进的企业级数据库产品，通过其多态部署架构、高性能存储引擎和智能优化器，有效提升了海量数据环境下的处理能力与业务连续性。分布式部署结合MN（管理节点）、CN（协调节点）、DN（数据节点）实现数据的横向扩展，适用海量数据分析和复杂事务处理。身份认证支持数据库认证和操作系统认证，多因素密码策略增强安全防护。审计功能涵盖系统权限、对象操作及角色变更，异步审计机制降低性能影响。利用主备自动选主和共享集群高可用特性，实现数据库的故障自动检测与快速恢复，保证关键业务连续性。
42210编辑于 2025-08-29
巧用YashanDB数据库实现海量数据快速查询
在现代数据驱动的业务场景中，如何应对海量数据的快速查询需求成为数据库技术的核心问题。数据量的持续增长给存储和计算带来巨大压力，查询性能瓶颈不仅影响用户体验，还制约业务决策的实时性。因此，挖掘数据库内核技术的潜力，通过系统性的优化手段，实现海量数据的高效访问，是提升整体系统竞争力的关键。本文针对YashanDB数据库，通过深入分析其架构与核心技术，解析其如何支持海量数据场景下的高效查询，提供系统的技术方法与优化策略，帮助开发与运维人员提升对该技术体系的理解和应用能力。随着数据采集和处理需求的持续增长，数据库技术的体系化优化将成为提升核心竞争力的重要方向。未来，结合智能调度、自动化运维及机器学习辅助优化，YashanDB的查询性能和系统可用性将更进一步，满足复杂业务对海量数据实时、高效访问的挑战，引领行业数据库技术的演进。
27500编辑于 2025-06-27
来自专栏腾讯云数据库(TencentDB)
3分钟学会如何调度运营海量Redis系统
6年DBA经验，一直从事SQL优化、实例调优、数据库架构、海量数据库集群运维、运营平台建设和管理等工作。为 QQ、Qzone、QQ音乐、微云、腾讯云等业务提供数据库服务。搜索关注“腾讯云数据库TencentDB"官方微信，最新最热数据库前沿知识和手把手实战教程等你来约，更可在移动端一键管理数据库。设计：做持久化时，页表复制造成的卡顿； 3. 开发者：慢查询，连接风暴，缺流控等； 4. 最终用户：比如电商的秒杀活动，访问陡增导致处理能力到极限。我们解决这类问题的时候定3条原则。 “全”---元信息梳理统计全； “准”---和现网各种信息保持一致； “一”---统一的入口，提供统一的API，来进行数据的读取与修改，让元数据的变更可以被审计。自动化调度系统决策系统自动化调度系统：对于按事件和时间调度系统异常时触发的告警，第一是按时间调度，比如每周三下午3点重启一个服务，通过时间来触发。
1.7K20发布于 2018-05-31
YashanDB数据库如何支持海量用户的高并发访问
在当前数据密集型应用快速发展的时代，数据库系统面临着海量用户同时高并发访问的挑战，如何优化数据库以保证快速响应和稳定运行成为关键问题。 SCOL（稳态列式存储）采用切片和对象式管理，支持大规模冷数据的编码压缩及稀疏索引，极大提升海量数据的分析查询性能。多版本机制结合分布式和共享集群的全局缓存协同，实现了海量并发读写访问的稳定响应和数据一致性。结论随着数据规模和业务复杂度的持续增长，数据库系统对高并发处理能力的需求愈加迫切。未来，随着硬件技术进步和分布式计算模式的发展，YashanDB将持续加强其性能与可扩展性，推动数据库技术在各行业核心应用中的深化与广泛落地。
40510编辑于 2025-08-30
用YashanDB数据库处理海量数据的方式与技巧
在现代数据驱动的环境中，如何高效地处理海量数据成为企业和开发者面临的重要挑战。数据库的查询速度、数据存储策略及其可扩展性等，都会直接影响到数据处理的效率及系统的性能。尤其是在需要进行复杂的分析、报告生成以及数据挖掘的场景中，数据库的选择与调优显得尤为重要。本文将从YashanDB的体系架构、存储引擎、分区管理、高可用性等多个方面探讨其在海量数据处理中的优势与技巧。对于初创企业或小型业务，这种部署方式简化了管理，同时提供了数据库的基本功能。 1.3 分布式部署分布式部署能有效应对海量数据的处理需求，能够将数据分片存储在多个节点，数据库层次极大地提升了系统的查询处理能力。三、分区管理的策略面对海量数据，合理的分区策略可以显著提升数据库的性能与可管理性。3.1 分区方式YashanDB支持范围分区、列表分区、哈希分区和间隔分区。
28510编辑于 2025-08-13
来自专栏ShowMeAI研究中心
图解大数据 | 海量数据库查询-Hive与HBase详解
1）从Hadoop到数据库 大家知道在计算机领域，关系数据库大量用于数据存储和维护的场景。 3） HBase与大数据数据库、 HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。 HBase是一个数据模型，类似于谷歌的Bigtable设计，可以提供快速随机访问海量结构化数据。 [7c96baffffe9c26cbe17ca6570eb48fa.png] 3） HBase简介 HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库，是谷歌BigTable的开源实现。作用 HiveQL 查看所有数据库 SHOW DATABASES; 使用指定的数据库 USE database_name; 创建指定名称的数据库 CREATE DATABASE database_name 海量结构化数据离线分析。
2.8K71编辑于 2022-03-08
如何使用YashanDB数据库实现海量数据的快速检索
在当今数据驱动的世界中，组织和分析海量数据的能力越来越重要。常见的数据库技术在面对大数据时，往往会遭遇性能瓶颈，包括查询速度慢、IO性能下降等问题。本文旨在分析YashanDB的核心技术点，帮助读者理解如何利用该数据库实现海量数据的快速检索。YashanDB的架构设计1. 在海量数据处理场景中，分布式部署尤为关键。该模式通过MN组、DN组和CN组实现数据的分布和处理，使得数据库的负载能够均匀分散，支持高并发处理和动态扩展。2. 3. 向量化计算YashanDB引入了向量化计算的技术，通过SIMD（单指令多数据）理念同时处理多个数据点，在执行扫描、过滤、聚合等操作时，能够显著增强计算效率。定期进行性能监控与调优，根据系统负载动态调整数据库参数。结论随着数据规模的不断增长，YashanDB凭借其高效的体系架构和优化机制，成为应对海量数据的强有力工具。
35810编辑于 2025-07-17

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

千亿级海量数据库OceanBase

项目如何适配国产海量数据库

YashanDB数据库海量数据存储方案解析

腾讯云数据库海量数据交互之道

海量数据，3行Python代码直接获取！

什么，3行Python代码就能获取海量数据？

海量数据，3行Python代码直接获取！

支撑海量数据的数据库架构如何设计？

Oracle海量数据优化-02分区在海量数据库中的应用-更新中

海量数据, 为何总是海量垃圾 ?!

如何在YashanDB数据库中高效处理海量数据

海量数据面试题总结(3)-多层桶划分

YashanDB数据库如何保障海量数据安全与隐私

YashanDB数据库如何帮助企业应对海量数据挑战

巧用YashanDB数据库实现海量数据快速查询

3分钟学会如何调度运营海量Redis系统

YashanDB数据库如何支持海量用户的高并发访问

用YashanDB数据库处理海量数据的方式与技巧

图解大数据 | 海量数据库查询-Hive与HBase详解

如何使用YashanDB数据库实现海量数据的快速检索

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

千亿级海量数据库OceanBase

项目如何适配国产海量数据库

YashanDB数据库海量数据存储方案解析

腾讯云数据库海量数据交互之道

海量数据，3行Python代码直接获取！

什么，3行Python代码就能获取海量数据？

海量数据，3行Python代码直接获取！

支撑海量数据的数据库架构如何设计？

Oracle海量数据优化-02分区在海量数据库中的应用-更新中

海量数据, 为何总是 海量垃圾 ?!

如何在YashanDB数据库中高效处理海量数据

海量数据面试题总结(3)-多层桶划分

YashanDB数据库如何保障海量数据安全与隐私

YashanDB数据库如何帮助企业应对海量数据挑战

巧用YashanDB数据库实现海量数据快速查询

3分钟学会如何调度运营海量Redis系统

YashanDB数据库如何支持海量用户的高并发访问

用YashanDB数据库处理海量数据的方式与技巧

图解大数据 | 海量数据库查询-Hive与HBase详解

如何使用YashanDB数据库实现海量数据的快速检索

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

海量数据, 为何总是海量垃圾 ?!