首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 分布式内存网格中的聚合

    今天,我们看到越来越多的应用程序不再构建在关系数据库上,而是建立在分布式环境上。发生这种情况是因为它们需要可扩展性和高可用性,而且还需要能够提供高吞吐量和低延迟,这是旧版关系数据库无法实现的。 如今,分布式环境和内存数据网格比几年前更先进,但是实现起来也比关系数据库更加复杂。 由于分布式数据网格分布式方式存储数据,创建分布式数据库,因此有一些操作不太直观,例如连接查询和聚合操作。 然而,对于分布式内存数据网格,我们甚至不知道员工对象和部门对象是不是在同一个节点上(除非我们将它们路由到一起,这并不总是最佳实践)。 或者查询平均工资高于X的部门: Select avg(salary) from employees group by department_id having avg(salary) > X 我们如何在分布式数据网格中执行这些任务 return groupByValue.getDouble("avg(salary)")> 18000; } })); 总的来说,如果我们想要运行一个操作,比如聚合,我们需要克服使用分布式数据网格的非直观限制

    1.8K100发布于 2018-01-12
  • 来自专栏信达雅

    分布式内存网格中的聚合查询

    近年来,我们看到越来越多的应用程序不再构建在关系型数据库上,而是建立在分布式环境上。发生这种情况是因为它们需要可扩展性和高可用性,而且还需要能够提供高吞吐量和低延迟,这是传统都关系型数据库无法实现的。 现在,分布式环境和内存数据网格比几年前更先进,但比关系型数据库更复杂。 由于分布式数据网格分布式方式存储数据,创建分布式数据库,因此有一些操作不太直观,例如连接查询和聚合查询。 但是,对于分布式内存数据网格,我们甚至不知道员工对象和它的部门对象是否在同一个节点上(除非我们将它们路由到一起,这并不总是最佳实践)。 或者只查询薪水高于 X 的部门: Select avg(salary) from employees group by department_id having avg(salary) > X 我们如何在分布式数据网格中执行这些任务 groupByValue) { return groupByValue.getDouble(“avg(salary)”) > 18000; } })); 总而言之,如果我们想要进行 SQL 查询,比如聚合查询,我们需要克服分布式数据网格的非直观限制

    2.6K100发布于 2018-01-05
  • 来自专栏大数据

    内存计算网格解释

    IMCG - 内存计算网格 Dmitriy提出的主要想法之一便是内存存储(IMDG)和内存处理(IMCG)两者相互集成的重要性,这能够方便构建真正可扩展的应用程序。 IMDG关注于通过把数据分布在网格之间可用的计算机中从而解决数据分布式内存存储和大数据集管理,而IMCG更专注于在同一网格上的同一组计算机上有效地执行算法(即用户代码或指令)。 例如,GridGain的IMCG能为以下执行模型直接提供支持: MapReduce的处理 GridGain提供针对内存优化的通用分布式fork-join类型处理。 ,然后在内存中生成中间结果,最后创建结果内存。 节点本地缓存 当在分布式环境中工作时,通常需要在每个网格节点上具有一致的本地状态,并在各种作业执行之间重复使用。

    2.1K90发布于 2018-05-29
  • 内存数据网格主要特性简介

    内存数据网格(IMDG)与MMDB相同,它也将数据存储在主内存中,但它具有完全不同的架构。IMDG的特性可以总结如下: 数据分布并存储在多个服务器中。 每台服务器都在主动模式下运行。 缓存系统 内存数据网格(IMDG) 读 如果数据在缓存中,则不会从数据库中读取数据。 分布式集合 你可以使用DistributedSet(分布式集合),DistributedList(分布式列表)或DistributedQueue(分布式队列)。 分布式主题(Topic)和分布式事件 HazelCast提供了主题阅读的功能,以保证发布消息的顺序。这意味着你可以将其用作分布式消息队列系统。 在很多情况下,分布式映射可以可靠地替换RDBMS表。某些产品提供分布式锁定,如果可以基于这种分布式锁定提供完整性约束功能,则可以使用IMDG替换RDBMS。

    4.3K40发布于 2018-05-21
  • 来自专栏超级架构师

    分布式数据网格】如何超越单片数据湖迁移到分布式数据网格

    我展示了我们如何将过去十年在构建分布式架构方面的知识应用到数据领域;我将介绍一种新的企业数据架构,我称之为数据网格。 在继续阅读之前,我的要求是暂时搁置当前传统数据平台架构范式所建立的深层假设和偏见;对超越单一和集中式数据湖向有意分布式数据网格架构的可能性持开放态度;拥抱数据永远存在、无处不在和分布式的现实。 下一代企业数据平台架构 它通过分布式数据网格包含无处不在的数据。 那么我们上面讨论的故障模式和特征的答案是什么?在我看来,范式转变是必要的。 数据网格平台是一种有意设计的分布式数据架构,在集中治理和互操作性标准化下,由共享和协调的自助数据基础设施支持。我希望很清楚,它远离无法访问数据的碎片孤岛。 它们只是网格上的节点。我们很可能不需要数据湖,因为保存原始数据的分布式日志和存储可用于从不同的可寻址不可变数据集作为产品进行探索。

    67110编辑于 2022-07-29
  • 来自专栏进击的程序猿

    分布式共享内存

    本文是mit 6.824 Schedule: Spring 2016的第12课,前面课程内容可以在分布式找到,更多详细资料可以到:distributed-system查看。 介绍 在并发编程中,我们需要处理两个关键问题: 线程之间如何通信 线程之间如何同步 通信是指线程之间以何种机制来交换信息,在命令式编程中,线程之间的通信机制有两种: 共享内存 消息传递 我们从通信和同步两个维度来看共享内存和消息传递 在共享内存的并发模型里,线程之间共享程序的公共状态,线程之间通过写-读内存中的公共状态来隐式进行通信。在消息传递的并发模型里,线程之间没有公共状态,线程之间必须通过明确的发送消息来显式进行通信。 通过上面的介绍我们知道了共享内存是一种隐式的通信手段,需要显示的方法来实现同步。 而在分布式系统中,我们希望能够的是能尽可能的利用普通的机器,来达到并行计算的目标,而distributed shared memory (DSM) 在分布式系统中实现了共享内存,让所有process都共享一个全局地址空间

    2.8K20发布于 2018-08-23
  • 来自专栏mini188

    Apache Ignite高性能分布式网格框架-初探

    在openfire中使用的集群解决方案是代理+分布式内存。所谓代理便是通过一个入口转发请求到多个服务实例。而分布式内存就是解决服务实例间数据共享问题。通过这两步就可以搭建出一套水平扩展的集群系统。 openfire使用的分布式内存计算框架是hazelcast,并不了解它,大概只知道它是分布式网格内存计算框架。 Ignite是apache基金的一个开源项目,功能与hazelcast非常类似: Apache Ignite内存数据组织是高性能的、集成化的以及分布式内存平台,他可以实时地在大数据集中执行事务和计算 特性: 可以将Ignite视为一个独立的、易于集成的内存组件的集合,目的是改进应用程序的性能和可扩展性,部分组件包括: 高级的集群化 数据网格(JCache) 流计算和CEP 计算网格 服务网格 Ignite property> </bean> </property> </bean> 总结 可以看到Ignite的使用还是非常简单的,特别是其配置的简单性,很容易上手,轻松就搭建了一套分布式内存系统

    4.4K60发布于 2018-01-12
  • 来自专栏赵化冰的技术博客

    如何降低Istio服务网格中Envoy的内存开销

    Envoy的内存占用 在Istio服务网格中,每个Envoy占用的内存也许并不算多,但所有sidecar增加的内存累积起来则是一个不小的数字。 在进行商用部署时,我们需要考虑如何优化并减少服务网格带来的额外内存消耗。 ,一个Envoy的实际内存占用量达到了100M左右;网格中一共有466个实例,则所有Envoy占用的内存达到了466*100M=46.6G,这些增加的内存消耗是一个不容小视的数据。 总结 在Istio服务网格中,伴随应用部署的Envoy sidecar导致了较大的内存占用。 通过对sidecar镜像的内存进行限制,并通过Pilot对sidecar的缺省配置按照服务的实际关联关系进行细化调整,可以对Envoy的内存占用进行优化,减少Istio服务网格部署对内存的额外消耗。

    1.8K30编辑于 2022-08-01
  • 来自专栏CNCF

    如何降低Istio服务网格中Envoy的内存开销?

    Envoy的内存占用 在Istio服务网格中,每个Envoy占用的内存也许并不算多,但所有sidecar增加的内存累积起来则是一个不小的数字。 在进行商用部署时,我们需要考虑如何优化并减少服务网格带来的额外内存消耗。 ,一个Envoy的实际内存占用量达到了100M左右;网格中一共有466个实例,则所有Envoy占用的内存达到了466*100M=46.6G,这些增加的内存消耗是一个不容小视的数据。 通过优化配置降低Envoy内存占用 即使将内存降低到50M,在一些对资源要求比较严格的环境,例如边缘计算的场景中,网格中这些Envoy内存累加在一起也是不能接受的,因此需要想办法进一步降低Envoy的资源使用 总结 在Istio服务网格中,伴随应用部署的Envoy sidecar导致了较大的内存占用。

    2.3K10发布于 2019-12-04
  • 来自专栏智能大数据分析

    Spark分布式内存计算框架

    (二)Spark和MapReduce区别 Spark有着自己的生态系统,但同时兼容HDFS、Hive等分布式存储系统,可以完美融入Hadoop的生态圈中,代替MapReduce去执行更高的分布式计算 Spark实现了高效的DAG执行引擎,可以通过基于内存来高效处理数据流。计算的中间结果是存在于内存中的。 (一)基本概念 RDD:是Resillient Distributed Dataset(弹性分布式数据集)的简称,是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型。 ),RDD实际是分布在集群多个节点上数据的集合,通过操作RDD对象来并行化操作集群上的分布式数据。 如果数据需要复用,可以通过cache操作对数据进行持久化操作,缓存到内存中; 输出:当Spark程序运行结束后,系统会将最终的数据存储到分布式存储系统中或Scala数据集合中。

    98310编辑于 2025-01-22
  • 来自专栏超级架构师

    【数据网格】应用数据网格

    逐步从单一数据湖转移到分散的 21 世纪数据网格。 答案被称为“数据网格”。 如果您像我一样感受到公司当前数据架构的痛苦,那么您想迁移到数据网格。但是怎么做?这就是我在本文中探索的内容。 但首先,简要回顾一下数据网格。 那么数据网格方法呢? 这是具有数据网格架构的同一个电子商务网站。 Green: new data-APIs. 开始收集分布式服务的新功能请求。 到目前为止,您的中央数据湖将变得非常小,仅包含已连接和建模的数据,如果您开始转移人员,您的数据团队也会如此。 我们还可以看到从数据湖到数据网格的2-3种不同方式。

    1.9K10编辑于 2022-09-26
  • 来自专栏后端

    Java一分钟之-Hazelcast:内存数据网格

    Hazelcast是一款开源的内存数据网格(In-Memory Data Grid, IMDG)解决方案,专为分布式环境设计,提供了极高的数据访问速度和弹性扩展能力。 它允许开发者将数据存储在内存中,通过分布式计算提高应用的性能和可伸缩性。本文将深入浅出地介绍Hazelcast的核心概念、常见问题、易错点及其解决策略,并通过代码示例帮助读者快速上手。 分布式计算:支持MapReduce、分布式执行器等功能,可在数据所在位置直接进行计算,降低网络延迟。线性扩展:随着集群规模的扩大,数据和计算能力可平滑增加,实现近乎无限的水平扩展。 内存管理不当问题描述:未合理配置内存限制,可能导致内存溢出或资源争抢。避免策略:根据集群规模和业务需求,合理设置每台机器的内存分配。 结论Hazelcast作为一款强大的内存数据网格解决方案,极大地提升了Java应用的性能和可扩展性。

    1.5K10编辑于 2024-06-17
  • 来自专栏图形视觉

    网格简化

    原文链接 网格简化可以减少网格的三角片数量,同时尽量保持住网格的几何信息或其它属性(如纹理)。 通常情况下,我们讲的网格简化,需要保持住网格的拓扑结构,它区别于下图的Wrap操作。 它的特点: 计算速度相对较慢 对整体误差的控制优于局部操作 ---- 带纹理坐标的网格简化 单纯的网格简化和带纹理坐标的网格简化是有区别的,前者的简化的对象是下面左图所示的网格,后者的简化对象是UV域的网格 带纹理坐标的网格简化,不仅要尽量保持住网格的几何特征,而且还要保持住UV域网格的边界几何。特别是后者,如果UV网格的边界几何变化比较大,会使得网格纹理贴图在UV边界处的颜色割缝比较明显。 当网格简化数目太多的时候,绝大部分的简化点发生在UV网格的内部顶点,这也会导致原始网格的几何简化的比较厉害,并且在UV边界处的几何扭曲会比较大。

    4.7K30发布于 2019-10-22
  • 来自专栏图形视觉

    网格映射

    如果S和T有相同的网格连接关系,那么F可以是一个刚性变换。如果S和T的网格连接关系有差异,则S和T互为对方的Remesh网格。 这类的网格映射就更为复杂了,目前很有少这方面的研究。 另外,网格的参数化也是一类特殊的网格映射。如果参数域是平面,那么它就是网格的UV展开。 因为参数域一般是基本形状,所以这类网格映射都是放在网格参数化里进行讨论。这里介绍的网格映射,网格的形状是一般化的。 ---- 网格映射的性质 网格映射的计算,经常会考虑一些性质: 双射:两个网格在映射区域的映射,期望是一个双射。 扭曲度:映射扭曲度经常用于度量映射的好坏,优化能量里也常见扭曲度的度量。 ---- 网格映射的应用 网格映射有很多应用: 模板网格拟合 纹理迁移 形状插值 ---- 网格映射的计算方法 网格映射的计算方法有很多,常见的有这几种类型: 间接法 直接法 函数映射法 网格映射的计算方法中

    2K50发布于 2019-10-24
  • 来自专栏图形视觉

    网格测量

    网格上的测地线:网格上的测地线如果限制在网格的边上走,则为近似的测地线,如下图中间所示。如果测地线可以走网格的面,则为精确的测地线,如下图右所示。 测地线的应用:可以用于测量网格上两点之间的距离,比如下图测量鞋子。也可以用于线切割网格的应用中,比如UV展开网格前,需要先用测地线把网格割开。 可以通过曲率信息来改变网格的测度。如下图所示,中图的线为普通的测地线,右图是吸附到特征边的测地线。 ---- 软件中的单位系统 三维数据一般都有自己的单位,比如1可能代表1米或者1毫米。

    1.8K31发布于 2019-10-30
  • 来自专栏图形视觉

    网格分割

    原文链接 网格分割是什么 网格由顶点和面组成,我们对网格顶点或者面的进行分类,就是网格分割。它是一个分类问题,而分类问题是机器学习里的经典问题。 下面这张图很好的给网格分割方法做了个分类。 一个直观的想法是直接应用图像分割的方法来对网格进行分割。图像和网格的信息结构是有差异的,图像是规则的二维矩阵,网格是不规则的图结构。 那么最简单的可以把网格转化未规则的信息结构,比如把网格映射到二维图像,或者网格体素化。早些时候的网格深度学习方法就是采用的这些方法。 下面这个方法(MeshCNN: A Network with an Edge – Siggraph2019),就是直接在不规则的网格上进行深度学习: 网格的边类比图像的像素。

    1.7K50发布于 2019-10-23
  • 来自专栏smartguys

    (二) MdbCluster分布式内存数据库——分布式架构1

    (二) MdbCluster分布式内存数据库——分布式架构1   分布式架构是MdbCluster的核心关键,业界有很多相关的实现,却很少有文章详细的解释每个架构实现背后的细节和这么做的原因。 这个架构本身很简单,几乎可以从1-N无限复制,是一个完全的分布式架构,无单点故障。下面我们通过假设读者的问题,来一步步的介绍整个架构。   1. 数据是根据什么策略来进行分片的?   2. 

    1.8K30编辑于 2023-02-16
  • 来自专栏算法之名

    JVM内存分布式缓存Hazelcast 顶

    Hazelcast是一个内存分布式计算平台,用于管理数据并并行执行执行应用程序。 1. 它是用Java编写的。 2. 与其他一些内存数据库(如redis)不同,Hazelcast是多线程的,这意味着可从所有可用的CPU内核中受益。 3. 与其他内存数据网格不同 - 它设计用于分布式环境。 {Queue, Set, List, Map}分布式实现。 提供java.util.concurrency.locks.Lock分布式实现。 提供java.util.concurrent.ExecutorService分布式实现。 提供用于一对多关系的分布式MultiMap。 提供用于发布/订阅的分布式Topic(主题)。 Map,不相关的内容不做解释,只说明分布式缓存内容 @Slf4j @RestController public class LevelController { //创建分布式缓存节点 private

    1.6K20发布于 2019-08-20
  • 来自专栏全栈程序员必看

    icem合并面网格_ICEM CFD混合网格

    ICEM CFD 中合并多个网格 对于结构十分复杂的几何模型,若能够将几何体分割成多个部分由多人分别进行网格划分,生 成网格后能够对网格进行组装,这恐怕是很多人梦寐以求的功能了。 但是最 好是在同一个体上进行切割,否则网格组装的过程中会存在定位的问题。同一个体上切割的几 何则不会存在几何坐标定位的问题。 图 1 原始几何 图 2 几何 1 生成的网格 图 3 保存网格 1 、将几何 1.x_t 导入到 ICEM CFD 中进行网格划分。注意千万保证单位的一致,切记。 这里是一个长方体,网格划分方法就不多说了。预览网格如图 2 所示。选择菜单 File > Mesh > Load From Blocking 生成网格。 2 、保存网格。 3 、按照相同的步骤对模型 2 与模型 3 进行网格文件,同时保存网格文件为 2.uns 与 3.uns 。

    1.3K10编辑于 2022-09-01
  • 来自专栏超级架构师

    【数据网格架构】什么是数据网格——以及如何不将其网格

    与在一个中央数据湖中处理数据消耗、存储、转换和输出的传统单片数据基础设施不同,数据网格支持分布式、特定于领域的数据消费者,并将数据视为产品,每个领域处理自己的数据管道。 (不过,如果你还没有读过她的开创性文章,我强烈建议你读一读《如何从一个单一的数据湖转移到一个分布式的数据网格》,或者看看马克斯·舒尔特(Max Schulte)关于Zalando为什么要过渡到数据网格的技术演讲 面向领域的数据所有者和管道 数据网格联合了域数据所有者之间的数据所有权,域数据所有者负责将其数据作为产品提供,同时也促进了跨不同位置的分布式数据之间的通信。 相反,面向领域的数据架构(如数据网格)为团队提供了两全其美的优势:一个集中的数据库(或分布式数据湖),其中的域(或业务区域)负责处理自己的管道。 网格化还是不网格化:这是个问题 处理大量数据源并需要对数据进行试验(换句话说,快速转换数据)的团队考虑利用数据网格是明智的。 我们进行了一个简单的计算,以确定您的组织投资数据网格是否有意义。

    1.4K10编辑于 2022-09-26
领券