首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏爱可生开源社区

    11期:压缩

    {MYD,MYI} 3539537 116M -rw-r----- 1 mysql mysql 116M 3月 31 11:46 n1.MYD 3539536 1.4M -rw-r----- 1 mysql mysql 1.4M 3月 31 11:48 n1.MYI 对 MyISAM 的压缩,MySQL 通过自带程序 myisampack 来压缩,仅仅压缩数据,不对索引进行压缩。 {MYD,MYI} 3539542 31M -rw-r----- 1 mysql mysql 31M 3月 31 11:46 n1.MYD 3539536 1.4M -rw-r----- 1 mysql mysql 1.4M 3月 31 11:48 n1.MYI MyISAM 压缩非常适合只读的场景! 压缩率大约为 50% root@ytt-pc:/var/lib/mysql/3304/ytt# ls -sihl 总用量 11M 3539513 11M -rw-r----- 1 mysql mysql

    72320发布于 2020-08-21
  • 来自专栏职场亮哥

    Clickhouse创建分布式以及引擎介绍

    引擎 引擎(即的类型)决定了: 数据的存储方式和位置,写到哪里以及从哪里读取数据 支持哪些查询以及如何支持。 并发数据访问。 索引的使用(如果存在)。 是否可以执行多线程请求。 数据复制参数。 使用ReplicatedMergeTree和Distributed引擎构建我们的分布式,先看一个常用的结构: -- 每个机器都需要建立各自的replica table,也需要建Distributed delphi_membership_properties_replica, rand()); delphi_membership_properties_replica是各个机器上的本地表,delphi_membership_properties是分布式 要查看集群,可使用“system.clusters”。 ? 通过分布式引擎可以像使用本地服务器一样使用集群。但是,集群不是自动扩展的:必须编写集群配置到服务器配置文件中。 总结 clickhouse的分布式是一个彻底手动挡的分布式,无论是分布式集群的搭建还是还是引擎的维护都能体现引擎的定制化感觉,相较于其他分布式比如hadoop等分布式来说,需要手动维护的内容较多。

    7.8K61发布于 2020-10-10
  • 来自专栏Debian中国

    JDK 11 版本时间公布

    在 JDK 10 发布两天之后,Oracle Java 平台组首席架构师 Mark Reinhold 提出了 JDK 11 GA 发布的时间: 6 月 28 日:第一阶段开发(从主分支 fork) 7 到目前为止,包含在 JDK 11 中的 JEP 有: JEP-309:动态类文件常量 JEP-318:Epsilon:一款低开销的垃圾收集器 JEP-320:移除 Java EE 和 CORBA 模块 JEP-323:Lambda 参数的局部变量语法 JDK 11 的 早期体验版本 在 JDK 10 发布前的一个月就有了。 Reinhold 之前发了推文: JDK 11 版本包括 JEP 320(移除 Java EE 和 CORBA 模块),因此它们体积更小:减少了 9 个模块,文件大小少了 22 MB。 计划在 JDK 11 中移除的模块包括: java.xml.ws(JAX-WS,以及相关的 SAAJ 和 Web 服务元数据) java.xml.bind(JAXB) java.activation(JAF

    1.3K10发布于 2018-12-21
  • 来自专栏Lauren的FPGA

    查找用作分布式RAM

    SLICEM中的查找可用作分布式RAM。如果把FPGA比作大海,LUT就像一个个小的岛屿分布在这片大海上,或许这就是分布式RAM的名称由来。 以UltraScale Plus芯片为例,一个6输入查找可实现深度为64宽度为1的单端口RAM。同一个SLICEM中的8个LUT可级联构成512深度的RAM。 分布式RAM的优势在于轻便灵活。对于一些需要存储较少数据(通常不超过10Kb)的场合,例如,存储FIR滤波器的系数或者缓存中间处理过程中的数据,可获得比Block RAM更好的性能。 以深度为128,宽度为4的RAM为例,在Virtex-7,速度等级为-2的芯片上,分别采用Block RAM和分布式RAM,其结果如下图所示(图片来源ug949, v2015.3, table 5-10 结论: -在某些场合采用查找作为轻量级存储单元会有更好的效果 -在用作分布式存储单元(RAM/ROM)时,要注意逻辑级数对时序的影响

    1.4K20发布于 2019-10-31
  • 来自专栏爱可生开源社区

    分布式 | Global Left Join 拆分实现原因探究

    作者:郭奥门 爱可生 DBLE 研发成员,负责分布式数据库中间件的新功能开发,回答社区/客户/内部提出的一般性问题。 ---- 本文关键字:JOIN、原理解析、分库分 相关文章推荐: 分布式 | DBLE 之通过 explain 进行 SQL 优化 分布式 | dble 中分布式时间戳方式的全局序列 问题 前几天 场景重现 首先我们创建一个全局和一个拆分,各自设置两个分片节点,全局在两个节点数据一致,拆分 id=1、2 的在一个节点,id=5000001 的在另一个节点,其中 id=1 和 id=2 的只有 结果探究 根据以上使用 Mycat 和 DBLE 进行 “Global Left Join 拆分查询”得到不同的结果。 DBLE 内部对于这种查询作出了一些区分:全局只会下发一个实例,拆分都会下发,然后针对结果做合并。

    59220发布于 2020-07-02
  • 来自专栏java达人

    分布式系统模式11-HeartBeat

    来源: https://martinfowler.com/articles/patterns-of-distributed-systems/

    1.3K20发布于 2021-01-05
  • 来自专栏Java项目实战

    1100万大11秒SQL优化

    = te.Dwhere t.A = '' and t.B = ''and te.C = '' and t.D = 0group by t.B,t.C,te.X,te.id,te.Y分析执行计划因为te未用到索引造成全扫描大总数据条数那就看看为什么没走索引 先强制走te索引或者覆合索引效果显著但是现在在模拟生产数据后te仍然无法走任何索引思路一:查询t,te,全部索引show index from tshow index from te字段索引都有为什么不走

    27830编辑于 2023-06-30
  • 来自专栏Java项目实战

    1100万大11秒SQL优化

    因为te未用到索引造成全扫描 大总数据条数 ? 那就看看为什么没走索引 怎么才能走索引 业务能不能优化 影不影响主数据? 先强制走te索引或者覆合索引 效果显著 ? 但是现在在模拟生产数据后te仍然无法走任何索引 思路一: 查询t,te,全部索引 show index from t show index from te 字段索引都有为什么不走?

    44520发布于 2021-07-22
  • 来自专栏JiekeXu之路

    Oracle 11g 临时空间管理

    来源 | JiekeXu之路(ID: JiekeXu_IT) 转载请联系授权 | (微信ID:xxq1426321293) 大家好,我是 JiekeXu,很高兴又和大家见面了,今天分享Oracle 11g : SQL> create temporary tablespace temp1 tempfile '/u01/app/oracle/oradata/orcl/temp11.dbf' size 10M; shrink 操作 对临时空间进行shrink(11g新增功能) 排序等操作使用的临时段,使用完成后会被标记为空闲,表示可以重用,占用的空间不会立即释放,有时候临时空间会变得非常大,此时可以通过收缩临时空间来释放没有使用的空间 收缩临时空间是 ORACLE11g 新增的功能。 Oracle 12c 及以上版本补丁更新说明及下载方法(收藏版) Oracle 11.2.0.4 RAC 最新补丁下载(11.2.0.4.200714) 11g RAC 在线存储迁移实现 OCR 磁盘组完美替换

    2.8K41发布于 2020-10-30
  • 来自专栏Java多线程

    MyCat11——分片技术之全局

    1 问题在实际的业务中,有些中的数据非常稳定,几乎不会发生更新,比如用来存储行政区划数据,或者国家地区数据,这些数据稳定的,也被称为字典。 2 全局为了解决上述问题,在Mycat中引入了全局。 全局在mycat中的特征:全局的插入更新等操作,会实时在所有节点上执行,保持各个分片的数据一致全局的查询操作,仅从一个节点执行全局可以和任何一个进行JOIN操作通过全局以上特征,不难看出,通过全局的使用 通过全局和ER的分片策略,可以解决工作中遇到的绝大多数问题。3 实施3.1 修改 schema.xml 配置在 schema.xml 中配置全局信息。 dataNode 希望全局保存到哪些分片type 数据的类型,全局类型为 global修改后的配置文件如下3.2 重启mycat服务mycat restart3.3 创建字典因为在配置中定义的字典

    58010编辑于 2023-11-28
  • 来自专栏码匠的流水账

    聊聊clickhouse分布式的操作

    序本文主要研究一下clickhouse分布式的操作创建分布式CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]( )ENGINE = Distributed(c1, db1, distribute_test_local, rand());这里在c1的cluster定义了一个distribute_test_all的分布式 ,查询本地的distribute_test_local,而sharding_key采用的是随机的方式,将数据分布到每个节点的本地表创建本地表CREATE TABLE [IF NOT EXISTS] [ engine为MergeTree删除--删除分布式DROP TABLE distribute_test_all ON CLUSTER c1-删除本地表DROP TABLE distribute_test_local ON CLUSTER c1如果要彻底删除一张分布式则需要分别删除分布式和本地表小结clickhouse提供了分布式,针对insert和select的查询,会以分布式的方式作用于本地表。

    84610编辑于 2023-11-29
  • 来自专栏java_joseph

    分库分分布式id

    这篇专门来谈谈分布式id,也就是上一个文章抛出的问题分库分初探-腾讯云开发者社区-腾讯云 (tencent.com)需求在单库下,主键id,一般通过自增id来实现,但是分库分下。 就会导致id重复的问题,那么我们设计一个分布式id的需求,要达到哪些1,首先是唯一,这个是必须保证的,2、高效,分库分下,一般面向C端是高性能的业务,性能是必要的3、防止恶意用户根据id猜测常见方案数据库自增这个方案 占用资源Snowflake雪花算法twitter开源的分布式id算法,这个方案,不占用带宽,且有自增特性(时间戳)缺点:依赖系统时钟这里选择雪花算法,这个方法时很高效的,且有自增特性,还安全,因为它的自增不是按照数量的 id唯一,在分布式下,就要保证工作机器id不一样,否则就会出现id重复的问题这里可能不太好理解,下面填坑的时候会讲到2,时间回拨分布式下,要保证各个系统的时间一致,有业务需求下,有可能就需要调整,或者开发人员操作不当这个问题也要解决实战部署现在我们部署下分布式 雪花算法的应用,在这里采用配置文件的形式的设置,在实体类种,将自增id的策略给注掉当然这里也可把type改为雪花算法,倒是考虑到配置workId,就一并这样做了#id生成策略spring.shardingsphere.sharding.tables.traffic.key-generator.column

    69120编辑于 2023-08-04
  • 来自专栏码匠的流水账

    聊聊clickhouse分布式的操作

    序 本文主要研究一下clickhouse分布式的操作 创建分布式 CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster] ENGINE = Distributed(c1, db1, distribute_test_local, rand()); 这里在c1的cluster定义了一个distribute_test_all的分布式 ,查询本地的distribute_test_local,而sharding_key采用的是随机的方式,将数据分布到每个节点的本地表 创建本地表 CREATE TABLE [IF NOT EXISTS] engine为MergeTree 删除 --删除分布式 DROP TABLE distribute_test_all ON CLUSTER c1 -删除本地表 DROP TABLE distribute_test_local ON CLUSTER c1 如果要彻底删除一张分布式则需要分别删除分布式和本地表 小结 clickhouse提供了分布式,针对insert和select的查询,会以分布式的方式作用于本地表。

    79610编辑于 2023-11-29
  • 来自专栏数据饕餮

    数据仓库专题(11)-可以作为维度使用的事实

    KDT#13 可以作为维度使用的事实 事实从粒度的角度分为三种,分别是交易粒度事实、周期快照事实和累计快照事实。 交易粒度事实能提供某个确切时刻的描述信息。 这是一个典型的记录的度量事实都是文本型描述信息的事实。这样的事实和维度之间的区别并不明显。 这个事实中有三个是关联到普通维度的外键,分别是变更日期、代理和交易类型。 帐户号(SK)是帐户的代理键,也是这个事实的主键,它标识了这个事实中的每一次变化。 我们可以将该事实中的帐户号代理键做TYPE 2型缓慢变化维处理,并将它关联到其他事实作为外键。 ) 对后一个事实进行分析,其中的一条记录可以准确的对应到前一张事实中相应时点的帐号信息上,即我们可以得到每一次交易时点时帐户对应的客户信息。 我们会发现,前一张事实和维度并没有什么差别。

    1.3K20发布于 2019-01-14
  • 来自专栏函数式编程语言及工具

    Akka(11): 分布式运算:集群-均衡负载

    集群构建是ActorSystem层面上的,可以是纯粹的配置和部署行为;分布式Actor程序编程实现了Actor消息地址的透明化,无须考虑目标运行环境是否分布式的,可以按正常的Actor编程模式进行。   既然分布式的Actor编程无须特别针对集群环境,那么摆在我们面前的就是多个可以直接使用的运算环境(集群节点)了,现在我们的分布式编程方式应该主要聚焦在如何充分使用这些分布的运算环境,即:如何把程序合理分配到各集群节点以达到最优的运算输出效率

    2.5K70发布于 2018-01-05
  • 来自专栏武军超python专栏

    11月9日python分布式爬虫

    另外,如果需要继承,也可以定义为类方法,实例对象和类对象都可以调用 使用分布式必须要安装: pip install scrapy-redis 分布式分布式爬虫的难点在于多台机器之间怎么互相通信而防止爬取重复的 url才能爬取一个url,不能自动爬取的话首先看一下域名是否正确,如果实在不行的话就把redis数据库 清空一下(flushdb),可能是由于存储爬取过的url那个列表的上次运行缓存太多造成的 使用分布式需要使用 如果不指定的话默认就是相对路径的当前的目录下: 如果使用/来表示路径可以直接写绝对路径,如果使用\则需要在绝对路径的前面加r来表示不转义,以原字符解释, 路径的 最后一定要加/表示最后那个文件下: with open('G:/第四阶段/11 utf8') as f:     f.write((item['aname']+','+item['atype'] + '\n'))     f.close() with open(r'G:\第四阶段\11

    46920发布于 2019-02-25
  • 来自专栏Python数据结构与算法

    数据结构与算法-(11)---有序(OrderedList)

    知识回顾及总结 上一次我们学习了无序之链表和列表,知道了链表的特点是顺藤摸瓜结构 通俗的讲就是链表相当于火车(如果元素放在链表后面,找那个车厢需要从头开始往后找) 有序的引入 今天,我们来学习有序 - OrderedList-需要增加属性进行位置参照-所以需要对表头进行处理 有序是一种数据项依照其某可比性质如整数大小、字母先后)来决定在列表中的位置 数值越小位置越前,数值越大位置越后. 实现有序 1.有序-类的构造方法 class Orderedlist: def __init__(self): self.head = None 2.有序-search方法的实现 但是,对于有序,如果目标元素不在列表中,可以利用元素有序的特点终止寻找. 有序和无序一样,由于current本身无法提供对待修改节点进行访问, 因此我们需要额外引用previous def add(self,item): #初始化两个外部引用

    35910编辑于 2024-01-18
  • 来自专栏golang算法架构leetcode技术php

    golang刷leetcode 技巧(11) 课程 III

    courses,p+1,end) } } /* [[5,5],[4,6],[2,6]] [[7,16],[2,3],[3,12],[3,14],[10,19],[10,16],[6,8],[6,11

    42510编辑于 2022-08-02
  • 来自专栏全栈程序员必看

    oralce11g 注冊卸载20140810

    -HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE] [-HKEY_LOCAL_MACHINE\SOFTWARE\ODBC\ODBCINST.INI\Oracle in OraDb11g_home1 eventlog\Application\OracleDBConsolefastatm] [-HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\services\Oracle11 services\OracleMTSRecoveryService] [-HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\services\OracleOraDb11g_home1TNSListener

    32110编辑于 2022-07-08
  • 来自专栏黑客下午茶

    在 Kubernetes 上快速测试 Citus 分布式 PostgreSQL 集群(分布式,共置,引用,列存储)

    目录 准备工作 创建分布式 使用共置(Co-location)创建分布式 创建引用 使用列式存储创建 准备工作 这里假设,你已经在 k8s 上部署好了基于 Citus 扩展的分布式 PostgreSQL 创建分布式 create_distributed_table 将在本地或工作节点之间透明地切分您的。 具有相同分布列的分布式可以位于同一位置,以实现分布式之间的高性能分布式连接(join)和外键。 https://docs.citusdata.com/en/stable/articles/aggregation.html 存储过程 https://www.citusdata.com/blog/2020/11 您可以单独使用列存储,也可以在分布式中使用,以结合压缩和分布式查询引擎的优势。 使用列式存储时,您应该只使用 COPY 或 INSERT..SELECT 批量加载数据以实现良好的压缩。

    3.2K20编辑于 2022-03-31
领券