首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏java开发的那点事

    Activiti7 介绍

    由于Activiti自生成的较多,这里先对activiti自生成数据库进行介绍。 数据库的创建在后续的demo文章中进行介绍,并且后续会写一篇关于数据库详解的文章,这里先大概知道Activiti库的分类以及其作用。 如下图所示,是Activiti7自生成的25张数据。 ? 数据库的命名规则  Activiti的都以act_开头,第二部分是表示的用途的两个字母缩写标识,用途也和服务的API对应。 ? 数据分类 通用数据(act_ge_*) ?  

    1.6K41发布于 2020-09-30
  • 来自专栏职场亮哥

    Clickhouse创建分布式以及引擎介绍

    引擎 引擎(即的类型)决定了: 数据的存储方式和位置,写到哪里以及从哪里读取数据 支持哪些查询以及如何支持。 并发数据访问。 索引的使用(如果存在)。 是否可以执行多线程请求。 数据复制参数。 使用ReplicatedMergeTree和Distributed引擎构建我们的分布式,先看一个常用的结构: -- 每个机器都需要建立各自的replica table,也需要建Distributed delphi_membership_properties_replica, rand()); delphi_membership_properties_replica是各个机器上的本地表,delphi_membership_properties是分布式 要查看集群,可使用“system.clusters”。 ? 通过分布式引擎可以像使用本地服务器一样使用集群。但是,集群不是自动扩展的:必须编写集群配置到服务器配置文件中。 总结 clickhouse的分布式是一个彻底手动挡的分布式,无论是分布式集群的搭建还是还是引擎的维护都能体现引擎的定制化感觉,相较于其他分布式比如hadoop等分布式来说,需要手动维护的内容较多。

    7.8K61发布于 2020-10-10
  • 来自专栏机器学习/数据可视化

    pandas系列7-透视和交叉

    透视pivot_table是各种电子表格和其他数据分析软件中一种常见的数据分析汇总工具。 根据一个或者多个键对数据进行聚合 根据行和列上的分组键将数据分配到各个矩形区域中 一文看懂pandas的透视 Pivot_table 特点 灵活性高,可以随意定制你的分析计算要求 脉络清晰易于理解数据 操作性强,报表神器 参数 data: a DataFrame object,要应用透视的数据框 values: a column or a list of columns to aggregate, 关于pivot_table函数结果的说明: df是需要进行透视的数据框 values是生成的透视中的数据 index是透视的层次化索引,多个属性使用列表的形式 columns是生成透视的列属性 Crosstab 一种用于计算分组频率的特殊透视

    1.8K11发布于 2021-03-02
  • 来自专栏Lauren的FPGA

    查找用作分布式RAM

    SLICEM中的查找可用作分布式RAM。如果把FPGA比作大海,LUT就像一个个小的岛屿分布在这片大海上,或许这就是分布式RAM的名称由来。 从逻辑级数的角度看,一个深度为128,宽度为1的单端口RAM,需要消耗2个LUT,1个F7MUX,如下图所示,其逻辑级数为1。 当深度变为256时,则需要消耗4个LUT,2个F7MUX和1个F8MUX,其逻辑级数为2。 ? 分布式RAM的优势在于轻便灵活。 以深度为128,宽度为4的RAM为例,在Virtex-7,速度等级为-2的芯片上,分别采用Block RAM和分布式RAM,其结果如下图所示(图片来源ug949, v2015.3, table 5-10 结论: -在某些场合采用查找作为轻量级存储单元会有更好的效果 -在用作分布式存储单元(RAM/ROM)时,要注意逻辑级数对时序的影响

    1.4K20发布于 2019-10-31
  • 来自专栏爱可生开源社区

    分布式 | Global Left Join 拆分实现原因探究

    作者:郭奥门 爱可生 DBLE 研发成员,负责分布式数据库中间件的新功能开发,回答社区/客户/内部提出的一般性问题。 ---- 本文关键字:JOIN、原理解析、分库分 相关文章推荐: 分布式 | DBLE 之通过 explain 进行 SQL 优化 分布式 | dble 中分布式时间戳方式的全局序列 问题 前几天 场景重现 首先我们创建一个全局和一个拆分,各自设置两个分片节点,全局在两个节点数据一致,拆分 id=1、2 的在一个节点,id=5000001 的在另一个节点,其中 id=1 和 id=2 的只有 结果探究 根据以上使用 Mycat 和 DBLE 进行 “Global Left Join 拆分查询”得到不同的结果。 DBLE 内部对于这种查询作出了一些区分:全局只会下发一个实例,拆分都会下发,然后针对结果做合并。

    59220发布于 2020-07-02
  • 来自专栏码匠的流水账

    聊聊clickhouse分布式的操作

    序本文主要研究一下clickhouse分布式的操作创建分布式CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]( )ENGINE = Distributed(c1, db1, distribute_test_local, rand());这里在c1的cluster定义了一个distribute_test_all的分布式 ,查询本地的distribute_test_local,而sharding_key采用的是随机的方式,将数据分布到每个节点的本地表创建本地表CREATE TABLE [IF NOT EXISTS] [ engine为MergeTree删除--删除分布式DROP TABLE distribute_test_all ON CLUSTER c1-删除本地表DROP TABLE distribute_test_local ON CLUSTER c1如果要彻底删除一张分布式则需要分别删除分布式和本地表小结clickhouse提供了分布式,针对insert和select的查询,会以分布式的方式作用于本地表。

    84610编辑于 2023-11-29
  • 来自专栏java_joseph

    分库分分布式id

    这篇专门来谈谈分布式id,也就是上一个文章抛出的问题分库分初探-腾讯云开发者社区-腾讯云 (tencent.com)需求在单库下,主键id,一般通过自增id来实现,但是分库分下。 就会导致id重复的问题,那么我们设计一个分布式id的需求,要达到哪些1,首先是唯一,这个是必须保证的,2、高效,分库分下,一般面向C端是高性能的业务,性能是必要的3、防止恶意用户根据id猜测常见方案数据库自增这个方案 占用资源Snowflake雪花算法twitter开源的分布式id算法,这个方案,不占用带宽,且有自增特性(时间戳)缺点:依赖系统时钟这里选择雪花算法,这个方法时很高效的,且有自增特性,还安全,因为它的自增不是按照数量的 id唯一,在分布式下,就要保证工作机器id不一样,否则就会出现id重复的问题这里可能不太好理解,下面填坑的时候会讲到2,时间回拨分布式下,要保证各个系统的时间一致,有业务需求下,有可能就需要调整,或者开发人员操作不当这个问题也要解决实战部署现在我们部署下分布式 雪花算法的应用,在这里采用配置文件的形式的设置,在实体类种,将自增id的策略给注掉当然这里也可把type改为雪花算法,倒是考虑到配置workId,就一并这样做了#id生成策略spring.shardingsphere.sharding.tables.traffic.key-generator.column

    69120编辑于 2023-08-04
  • 来自专栏码匠的流水账

    聊聊clickhouse分布式的操作

    序 本文主要研究一下clickhouse分布式的操作 创建分布式 CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster] ENGINE = Distributed(c1, db1, distribute_test_local, rand()); 这里在c1的cluster定义了一个distribute_test_all的分布式 ,查询本地的distribute_test_local,而sharding_key采用的是随机的方式,将数据分布到每个节点的本地表 创建本地表 CREATE TABLE [IF NOT EXISTS] engine为MergeTree 删除 --删除分布式 DROP TABLE distribute_test_all ON CLUSTER c1 -删除本地表 DROP TABLE distribute_test_local ON CLUSTER c1 如果要彻底删除一张分布式则需要分别删除分布式和本地表 小结 clickhouse提供了分布式,针对insert和select的查询,会以分布式的方式作用于本地表。

    79610编辑于 2023-11-29
  • 来自专栏chester技术分享

    .NET分布式Orleans - 7 - Streaming

    分布式协作:Streaming也可以用于实现分布式系统中的协作和通信。例如,多个节点可以发布状态更新到流中,其他节点可以订阅这些流以获取最新的状态信息。

    40710编辑于 2024-04-13
  • 来自专栏分布式锁原理与源码

    分布式锁—7.Curator的分布式

    InterProcessMutex.acquire()尝试获取锁(4)LockInternals.attemptLock()尝试获取锁(5)不同客户端线程获取锁时的互斥实现(6)同一客户端线程可重入加锁的实现(7) (7)客户端线程释放锁的实现客户端线程释放锁时会调用InterProcessMutex的release()方法。首先对LockData里的重入计数器进行递减。当重入计数器大于0时,直接返回。 07a641d351f2-__READ__0000000004二.然后另一个客户端线程2过来尝试获取写锁于是该线程2会也会先在/locks目录下创建出如下写锁的临时顺序节点:/locks/9361-4fb7- 0000000005接着该线程会获取/locks目录的当前子节点列表并进行排序,结果如下:[43f3-4c2f-ba98-07a641d351f2-__READ__0000000004,9361-4fb7- (7)先获取写锁 + 再获取写锁的情形分析如果客户端线程1先获取了写锁,然后后面客户端线程2来获取这个写锁。此时线程2会发现自己创建的节点排在节点列表中的第二,不是第一。

    20110编辑于 2025-05-15
  • 来自专栏黑客下午茶

    在 Kubernetes 上快速测试 Citus 分布式 PostgreSQL 集群(分布式,共置,引用,列存储)

    目录 准备工作 创建分布式 使用共置(Co-location)创建分布式 创建引用 使用列式存储创建 准备工作 这里假设,你已经在 k8s 上部署好了基于 Citus 扩展的分布式 PostgreSQL 创建分布式 create_distributed_table 将在本地或工作节点之间透明地切分您的。 具有相同分布列的分布式可以位于同一位置,以实现分布式之间的高性能分布式连接(join)和外键。 默认情况下,分布式将根据分布列的类型位于同一位置,但您可以使用 create_distributed_table 中的 colocate_with 参数显式定义同一位置。 您可以单独使用列存储,也可以在分布式中使用,以结合压缩和分布式查询引擎的优势。 使用列式存储时,您应该只使用 COPY 或 INSERT..SELECT 批量加载数据以实现良好的压缩。

    3.2K20编辑于 2022-03-31
  • 来自专栏黑客下午茶

    Citus 分布式 PostgreSQL 集群 - SQL Reference(查询分布式 SQL)

    目录 聚合函数 Count (Distinct) 聚合 HyperLogLog 列 估计 Top N 个项 基本操作 现实例子 百分位计算 限制下推 分布式的视图 连接(Join) 共置连接 引用连接 ))::text) FROM normal_rand(1000, 5, 0.7) i; -- => {"2": 1, "3": 74, "4": 420, "5": 425, "6": 77, "7" -L https://examples.citusdata.com/customer_reviews_2000.csv.gz | \ gunzip > reviews.csv 接下来,将其摄取到分布式中 SET citus.limit_clause_row_fetch_count to 10000; 分布式的视图 Citus 支持分布式的所有视图。 共置连接 当两个共置时,它们可以在它们的公共分布列上有效地 join。co-located join(共置连接) 是 join 两个大型分布式的最有效方式。

    4.1K20编辑于 2022-03-31
  • 来自专栏大数据成神之路

    「Clickhouse系列」分布式&本地表详解

    ClickHouse分布式和本地表 ClickHouse的分为两种 分布式 一个逻辑上的, 可以理解为数据库中的视图, 一般查询都查询分布式. 分布式引擎会将我们的查询请求路由本地表进行查询, 然后进行汇总最终返回给用户. 本地表 实际存储数据的 1. 数据的一致性问题, 先在分布式所在的机器进行落盘, 然后异步的发送到本地表所在机器进行存储,中间没有一致性的校验, 而且在分布式所在机器时如果机器出现down机, 会存在数据丢失风险. Distributed Table & Distributed Engine ClickHouse分布式的本质并不是一张, 而是一些本地物理(分片)的分布式视图,本身并不存储数据. 分布式的引擎为Distributed.

    9.1K22编辑于 2022-04-13
  • 来自专栏IT云清

    ClickHouse系列--分布式写入流程

    摘要:在向ck集群写入数据的过程,有2种方案,一种是直接写本地表,一种是通过Distributed引擎写分布式。本文介绍写分布式的核心流程。 本地表log_local对应的分布式为log_all。 假设请求A进来后请求到cluster1的分布式log_all,要写入100条数据。 同步于异步 在Distributed向远端节点发送数据时,有2种模式,可以通过配置项设置: 1.同步写 在当前分片本地写入完成后,会等待所有分片写入完毕,才会返回写入成功的消息。

    3.3K20编辑于 2021-12-06
  • 来自专栏全栈程序员必看

    ZooKeeper实践方案:(7分布式

    1.基本介绍 分布式锁是控制分布式系统之间同步訪问共享资源的一种方式,须要相互排斥来防止彼此干扰来保证一致性。 利用Zookeeper的强一致性能够完毕锁服务。

    27010编辑于 2022-07-05
  • 来自专栏Deep learning进阶路

    2-7 顺序 和 链表 对比

    2-7 顺序 和 链表 对比 1、存储结构的不同 虽然它们同属于线性,但数据的存储结构有本质的不同: 顺序存储数据,需预先申请一整块足够大的存储空间,然后将数据按照次序逐一存储,逻辑关系就是靠元素间物理空间上的邻接关系来维持 链表 ,什么时候存储数据,什么时候才申请存储空间,数据之间的逻辑关系依靠每个数据元素携带的指针维持, 2、空间利用率 顺序的空间利用率显然要比链表高。 这就比顺序多耗费一点空间。 链表在存储数据时,每次只新开辟一个node的空间,且位置是随机的,会产生很多空间碎片,一定程序上造成了空间浪费。 类问题适合使用顺序。 这是因为,顺序中存储的元素可以使用数组下标直接访问,无需遍历整个,因此使用顺序访问元素的时间复杂度为 O(1);如果要在链表中访问元素,需要从头指针依次遍历,直到找到指定节点,花费的时间复杂度为

    43020发布于 2019-07-02
  • 来自专栏小白晋级大师

    分布式系统架构7:本地缓存

    这是小卷对分布式系统架构学习的第10篇文章,在开始学习分布式缓存之前,先来学习本地缓存的理论基础,了解为什么需要用缓存 1.引入缓存的影响 我们在开发时,用到缓存的情况,无非就是为了减少客户端对相同资源的重复请求 引入缓存的理由: 为了缓解CPU压力,将实时计算运行结果存储起来,节省CPU压力 为了缓解I/O压力,将原本对网络、磁盘的访问改为对内存的访问 2.缓存的属性 选择缓存时,主要考虑吞吐量、命中率、扩展功能、分布式支持 前3个这篇文章会讲,下一篇再讲分布式缓存 2.1吞吐量 并发场景下,每秒操作数OPS,反映了缓存的工作效率 如Java8并发包的ConcurrentHashMap,线程安全实现原理是CAS+synchronized

    31800编辑于 2025-01-17
  • 来自专栏全栈程序员必看

    rbac权限管理设计 7_数据库角色权限设计

    powerdesigen设计图如下: 权限与权限菜单关联、权限菜单关联与菜单都是一对一的关系。(文件、页面权限点、功能操作等同理)。 也就是每添加一个菜单,就得同时往这三个中各插入一条记录。 这样,可以不需要权限菜单关联,让权限与菜单直接关联,此时,须在权限中新增一列用来保存菜单的ID,权限通过“权限类型”和这个ID来区分是种类型下的哪条记录。 权限和功能操作多对多的关系。 请留意权限中有一列“权限类型”,我们根据它的取值来区分是哪一类权限,如“MENU”表示菜单的访问权限、“OPERATION”表示功能模块的操作权限、“FILE”表示文件的修改权限、“ELEMENT”表示页面元素的可见性控制等

    7.3K20编辑于 2022-11-10
  • 来自专栏大数据成神之路

    7-Flink的分布式缓存

    分布式缓存 Flink提供了一个分布式缓存,类似于hadoop,可以使用户在并行函数中很方便的读取本地文件,并把它放在taskmanager节点中,防止task重复拉取。 line : lines) { this.dataList.add(line); System.err.println("分布式缓存为 line : lines) { this.dataList.add(line); System.err.println("分布式缓存为

    90580发布于 2019-03-07
  • 来自专栏一英里广度一英寸深度的学习

    Zookeeper 分布式环境中的注册

    记得那时候2种主题的书特别多,注册和Bios。现在想想《教你21天玩转Bios》这样的书名都像个笑话儿。 这么说是因为BOIS和注册对普通用户,基本用不上。 但是注册其实是Windows系统中非常重要的组件,提供了配置存储、事件监听响应等机制,Windows中很多服务开发都需要依赖注册。 一、Zookeeper提供了分布式环境的注册服务 ZooKeeper 典型的应用场景,限于篇幅就不详细展开,百度或https://www.jianshu.com/p/1e052bddba80 命名服务 配置管理 集群管理 分布式锁 队列管理 当你了解了这些应用场景,会不会明白作者将zookeeper和注册对标的想法? 如果节点是临时节点,则表示创建该节点的会话的SessionID;如果节点是持久节点,则该属性值为0 dataLength 数据内容的长度 numChildren 数据节点当前的子节点个数 7.

    76130发布于 2018-09-12
领券