微信公众号:DBA随笔 01、如何判断Redis变慢了? 线上的Redis服务经经常有业务反馈响应慢的问题,针对这类问题,最好的分析方法是确定一个Redis的基准性能,然后去分析究竟什么原因导致的Redis变慢。 之前文章中,我们说过Redis变慢的两个主要原因, Redis内部阻塞式的操作或命令 CPU多核心及NUMA架构对Redis的影响, 其中,我们也对CPU多核和NUMA架构下的Redis性能优化进行了介绍 详情请参考: Redis变慢了,到底慢在哪儿?(2) 今天我们来看其他方面的性能优化。 AOF刷盘层面 除了命令级别的Redis变慢之外,还有其他层面的Redis变慢问题,我们来看AOF刷盘时候可能导致Redis变慢的一个瓶颈点。
那么问题来了,redis速度快的flag是直接写官网的公屏上,那我们不妨来推演一下,redis变慢的原因,知其然而知其所以然。 redis为何会变慢 随着时间的堆积,数据的累增,系统很直观的会感觉的变慢的现象,对于大型程序来说,主要是内存碎片啊、堆栈溢出啊等等这些关于垃圾回收机制导致的,另外的还是跟其他组件在配合中,网络开销导致的现象 找到你认为可能变慢的 Redis 实例,测试这个实例的基准性能 如果你观察到,这个实例的运行延迟是正常 Redis 基准性能的 2 倍以上,即可认为这个 Redis 实例确实变慢了 发现问题 业务服务器到 Redis 服务器之间的网络存在问题,例如网络线路质量不佳,网络数据包在传输时存在延迟、丢包等情况 Redis 本身存在问题,需要进一步排查是什么原因导致 Redis 变慢 分析问题 分析问题的三把斧 58358264 https://medium.com/rahasak/kafka-with-etcd3-d04f438aa639 https://www.jianshu.com/p/a036405f989c
比如在客户端做聚合运算 使用渐进式遍历代替全量查询命令,scan/sscan/zscan/hscan Bigkey bigkey的操作导致阻塞 分析 slowlog出现一些key的set/delete操作变慢 (bigkey 分配/释放内存缓慢) redis-cli --bigkeys扫描出很多bigkey 解决 优化业务,避免bigkey Redis 4.0+可开启lazy-free机制 大量key集中过期 Redis info中的expired_keys指标短期突增 业务使用EXPIREAT/PEXPIREAT命令 解决 优化业务,key的过期时间加上随机值进行打散,减小redis释放过期键的压力 内存达到 监控latest_fork_usec耗时是否变长 AOF使用awalys机制 awalys 会造成主线程堵塞 解决: everysecond机制 数据丢失不敏感则关闭aof 使用了swap 所有请求都变慢 不合理 Redis进程只绑定一个CPU逻辑核 NUMA架构下,网络中断处理程序和Redis进程没有绑定在同一个Socket下 解决: Redis进程绑定多个CPU逻辑核,比如2个逻辑核在1个物理核下 网络中断处理程序和
"0" 4) "-1" 2) 1) (integer) 32692 2) (integer) 1593763337 3) (integer) 5044 4) 1) "GET 当实例的内存达到了maxmemory后,你会发现之后的每次写入新的数据,有可能变慢了。 导致变慢的原因是,当Redis内存达到maxmemory后,每次写入新的数据之前,必须先踢出一部分数据,让内存维持在maxmemory之下。 网卡负载过高 如果以上产生性能问题的场景,你都规避掉了,而且Redis也稳定运行了很长时间,但在某个时间点之后开始,访问Redis开始变慢了,而且一直持续到现在,这种情况是什么原因导致的? 之前我们就遇到这种问题,特点就是从某个时间点之后就开始变慢,并且一直持续。这时你需要检查一下机器的网卡流量,是否存在网卡流量被跑满的情况。
"0" 4) "-1" 2) 1) (integer) 32692 2) (integer) 1593763337 3) (integer) 5044 4) 1) "GET 当实例的内存达到了maxmemory后,你会发现之后的每次写入新的数据,有可能变慢了。 导致变慢的原因是,当Redis内存达到maxmemory后,每次写入新的数据之前,必须先踢出一部分数据,让内存维持在maxmemory之下。 网卡负载过高 如果以上产生性能问题的场景,你都规避掉了,而且Redis也稳定运行了很长时间,但在某个时间点之后开始,访问Redis开始变慢了,而且一直持续到现在,这种情况是什么原因导致的? 之前我们就遇到这种问题,特点就是从某个时间点之后就开始变慢,并且一直持续。这时你需要检查一下机器的网卡流量,是否存在网卡流量被跑满的情况。
"0" 4) "-1" 2) 1) (integer) 32692 2) (integer) 1593763337 3) (integer) 5044 4) 1) "GET 当实例的内存达到了maxmemory后,你会发现之后的每次写入新的数据,有可能变慢了。 导致变慢的原因是,当Redis内存达到maxmemory后,每次写入新的数据之前,必须先踢出一部分数据,让内存维持在maxmemory之下。 网卡负载过高 如果以上产生性能问题的场景,你都规避掉了,而且Redis也稳定运行了很长时间,但在某个时间点之后开始,访问Redis开始变慢了,而且一直持续到现在,这种情况是什么原因导致的? 之前我们就遇到这种问题,特点就是从某个时间点之后就开始变慢,并且一直持续。这时你需要检查一下机器的网卡流量,是否存在网卡流量被跑满的情况。
图片一、Redis访问架构链路分析首先,在深入分析Redis服务前,需要弄清楚是不是真的Redis访问变慢了。 对于第一点从应用到Redis这条链路变慢的原因可能有如下两个:应用到Redis服务之间的链路出现问题了,比如Redis所在服务器网络负载过高丢包、交换机问题、Proxy变慢等;Redis本身确实因为一些原因变慢了 服务器配置比较低时延迟为 10ms 时,才认为 Redis响应变慢了,但是如果配置比较高,那么可能延迟是 1ms 时就可以认为 Redis 变慢了。 是否真的变慢了:在相同配置的服务器上,测试一个正常 Redis 实例的基准性能找到可能变慢的 Redis 实例,测试这个实例的基准性能对比这个实例的运行延迟与正常 Redis 基准性能,如果性能差距在两倍以上 ,就可以认为这个 Redis 服务确实响应变慢了如果确认是 Redis服务变慢了,那如何排查是哪里发生了问题呢?
00、Redis变慢了,到底慢在哪儿? 昨天的内容中,我们说了Redis变慢有可能存在的2个方面原因: 1、Redis内部的阻塞式操作或者命令 2、CPU核心以及NUMA架构 对于第一部分,主要是Redis自身的实现原理导致的,我们暂时不去做过多讨论 第二部分是在多核心CPU场景下,多核心之间的频繁上下文调度会导致Redis变慢,今天我们更近一步的分析一下多核心CPU场景以及NUMA架构下的Redis运行机制。 我们知道Redis之所以运行的如此之快,是基于下面3个特点: 1、纯内存访问 2、单线程架构避免上下文切换和锁竞争 3、IO多路复用 其中,第3点的IO多路复用这里展开一下,通常情况下,套接字网络模型分为阻塞式与非阻塞式 资源竞争,当后台子进程或者后台线程占用了CPU的资源时候,Redis的主线程响应就会被阻塞,从而变慢。
当 Redis 出现性能波动的时候,比如达到几秒到十几秒,这个很明显我们可以认定 Redis 性能变慢了。 有的硬件配置比较高,当延迟 0.6ms,我们可能就认定变慢了。 硬件比较差的可能 3 ms 我们才认为出现问题。 ❝那我们该如何定义 Redis 真的变慢了呢? 当你发现 Redis 运行时时的延迟是基线性能的 2 倍以上,就可以判定 Redis 性能变慢了。 只有超过该阈值的时间才会被记录,比如我们根据基线性能(3ms)的 3 倍设置阈值为 9 ms。 总结 如下检查清单,帮助你在遇到 Redis 性能变慢的时候能高效解决问题。
00、Redis变慢了,到底慢在哪儿? 最近由于工作需要,在维护线上的Redis,Redis相关的原理部分看的比较多,Redis最常见的业务问题就是响应慢,今天我们来看看Redis慢在哪里? 首先来看有可能引起Redis变慢的那些情况。其实,Redis变慢的主要因素是各种类型的阻塞,可以这么说:阻塞是Redis的噩梦。 总体上来说,Redis的阻塞存在很多可能,今天重点说以下2个方面: 1、Redis内部的阻塞式操作或者命令 2、CPU核心以及NUMA架构 01、Redis内部的阻塞式操作或命令 假设你的Redis 3、主从节点交互产生的阻塞 主从节点进行交互的时候,从节点上有2个阻塞点,第一是从节点需要使用flushdb清空数据库,如果从节点之前有数据,这可能造成阻塞;另外一个就是从节点需要加载主节点发送过来的RDB 如图为4核心CPU的架构,其中,CPU核心1、2在同一个Socket中,CPU核心3、4在另外一个Socket中。Socket之间,通过CPU总线来连接,每个Socket控制一块内存。
大家都是知道Redis纯内存数据库,处理速度很快,CPU架构,也会影响到 Redis 的性能 本文主要解决的一个问题在 Redis 为什么变慢,如何解决的? two different cores of the same CPU to benefit from the L3 cache Redis线程类型 配置 功能描述 CPU 绑定核心 主线程 server_cpulist 子进程 bgsave_cpulist 1,10-11 保存内存快照到磁盘(RDB 文件) 1, 10, 11 下面是分析过程 大纲如下 你会疑问:Redis大家都说它快,什么情况变慢 Redis 作为优秀的内存数据库 Redis 已在超过 60,000 个连接的情况下进行了基准测试, 并且仍然能够维持 50,000 q/s 的吞吐量。 怎么会变慢呢? 一、确定Redis是否真的变慢了 1. 运行时延迟是其基线性能的 2 倍及以上,就可以认定 Redis 变慢了 2.
127.0.0.1:6379> SLOWLOG get 51) 1) (integer) 32693 # 慢日志ID 2) (integer) 1593763337 # 执行时间 3) 当实例的内存达到了maxmemory后,你会发现之后的每次写入新的数据,有可能变慢了。 导致变慢的原因是,当Redis内存达到maxmemory后,每次写入新的数据之前,必须先踢出一部分数据,让内存维持在maxmemory之下。 网卡负载过高 如果以上产生性能问题的场景,你都规避掉了,而且Redis也稳定运行了很长时间,但在某个时间点之后开始,访问Redis开始变慢了,而且一直持续到现在,这种情况是什么原因导致的? 之前我们就遇到这种问题,特点就是从某个时间点之后就开始变慢,并且一直持续。这时你需要检查一下机器的网卡流量,是否存在网卡流量被跑满的情况。
前言Redis变慢排查的上一篇,我们是基于Redis命令为入口,比如命令使用不得当,bigkey问题,以及集中过期问题来看现象和如何进行优化处理的,认真读过的同学想必大家对这些现象和处理方式有了比较深的印象 方案没有最完美的,everysec同步机制同样存在导致Redis延迟变慢的情况。AOF耗时的刷盘操作不是已经创建了一个后台线程去处理吗,怎么还会影响Redis主进程呢? fsync 完成后,主线程执行 write 才能成功返回也就是说压力到了磁盘IO这边,因此磁盘IO压力过大,同样可能导致Redis主进程阻塞,主进程阻塞了,自然处理用户命令变慢了排查方式:1:info 策略采用的是everysec刷盘2:AOF着文件会越来越大,Redis还有一个rewrite策略,实现AOF文件的重写瘦身3:但是no-appendfsync-on-rewrite的策略是 no,这就会导致在进行 ,这里也不做深入说明,我也没具体深入了解过了总结到这里,关于影响Redis性能的因素下篇就分享完了相信如果能耐心地看到这里的同学,想必你肯定已经对 Redis 的变慢该如何处理有了很大的收获,同样对Redis
今天就可能引起Redis变慢的原因一一分析,上篇看完后你将会形成一个比较完整的排查思路方案!Redis真的变慢了吗? 因此需要确定是不是访问Redis服务变慢进而拖慢了整个服务的响应变慢,那就是先自查! 那该以什么标准来认定Redis变慢呢? :1:避免存储 bigkey,降低释放内存的耗时2:合理预估内存占用,避免达到内存的使用上限根据写入Key的类型、数量及平均大小计算预估写入一小部分比例的真实业务数据,然后进行预估3:Redis 4.0 ok,关于Redis变慢问题的上半部分就分享到这里了,下期讲继续更新其他可能导致Redis变慢的情况,朋友,点个关注不迷路!参考:Redis变慢?
体验过众多Netty的demo以后,在跟朋友分享后实现了页面昵称输入,消息可回车发送,页面保持输入框在底部,消息页面支持滚动,但是为什么当多客户端接入,消息会延迟,并注册变慢呢? 传统JAVA BIO 阻塞+同步 特点: 1.客户端启动一个socket 每个客户建立一个链接 2.判断服务器是否有线程响应,没有会等待或被拒绝 3.有线程,等待请求响应结束 体验代码 package 为什么会变慢呢? 2020-01-12收到消息{'code':10086,'mess':'迪丽热巴 2020年1月12日21:39:47'} 当前线程的id----24线程名称DEFAULTEVENTLOOPGROUP_3 1核啊,不管是cpu密集型,还是io密集型4个线程就够服务器响应的了,而且每个客户端为了保持长连接,还不会断开,所以当客户端多了,消息多了以后就会变慢,这严重违背了Nio的思想。
也就是从 Redis 角度来排查,是否存在导致变慢的场景,以及都有哪些因素会导致 Redis 的延迟增加,然后针对性地进行优化。 排除网络原因,如何确认你的 Redis 是否真的变慢了? 如果你观察到,这个实例的运行延迟是正常 Redis 基准性能的 2 倍以上,即可认为这个 Redis 实例确实变慢了 确认是 Redis 变慢了,那如何排查是哪里发生了问题呢? 和 IO 线程绑定到 CPU核心 0,2,4,6 server_cpulist 0-7:2 # 后台子线程绑定到 CPU核心 1,3 bio_cpulist 1,3 # 后台 AOF rewrite 我们继续分析还有什么场景会导致 Redis 变慢。 3)其它程序争抢资源 最后需要提醒你的是,你的 Redis 机器最好专项专用,只用来部署 Redis 实例,不要部署其他应用程序,尽量给 Redis 提供一个相对「安静」的环境,避免其它程序占用 CPU
Redis 作为优秀的内存数据库,其拥有非常高的性能,单个实例的 OPS 能够达到 10W 左右。但也正因此如此,当我们在使用 Redis 时,如果发现操作延迟变大的情况,就会与我们的预期不符。 你也许或多或少地,也遇到过以下这些场景: 在 Redis 上执行同样的命令,为什么有时响应很快,有时却很慢? 为什么 Redis 执行 SET、DEL 命令耗时也很久? 为什么我的 Redis 突然慢了一波,之后又恢复正常了? 为什么我的 Redis 稳定运行了很久,突然从某个时间点开始变慢了? ... 如果你并不清楚 Redis 内部的实现原理,那么在排查这种延迟问题时就会一头雾水。 如果你也遇到了以上情况,那么,这篇文章将会给你一个「全面」的问题排查思路,并且针对这些导致变慢的场景,我还会给你一个高效的解决方案。
提高系统的延伸性 2、主从复制过程: 1)slave与master建立连接,发送sync同步命令; 2)master开启后台进程,将数据库快照保存到文件中,同时master主进程会开始收集新的写命令并缓存; 3) 后台完成保存后,就将文件发送给slave; 4)slave将此文件保存到硬盘上; 3、主从复制配置: 准备3台linux服务器,分别192.168.90.121(主)、192.168.90.122、192.168.90.123 redis2.6以后提供了一个哨兵机制。哨兵的含义就是监控redis系统的运行状况,主要功能有两点: 1. 监控主数据库和从数据库是否运行正常。 2. /usr/local/redis/etc/sentinel.conf --sentinel & (3)查看哨兵相关信息 [root@wlan121 bin]# redis-cli -h 192.168.1.122 -p 26379 info Sentinel 高级命令六:持久化 redis是一个支持持久化的内存数据库,也就是说redis需要经常将内存中的数据同步到硬盘来保证持久化。
Redis高性能原因 1.基于内存的访问,非阻塞I/O,Redis使用事件驱动模型epoll多路复用实现,连接、读写、关闭都转换为事件不在网络I/O上浪费过多的时间 2.单线程避免的高并发的时候,多线程有锁的问题和线程切换的 3.使用C语言编写,更好的发挥服务器性能,并且代码简洁,性能高 三.特点 Redis支持多种数据类型,适应更多的场景需求。 提供了流水线(Pipeline) 功能, 这样客户端能将一批命令一次性传到 Redis, 减少了网络的开销。
127.0.0.1:6379> lpush list a (integer) 1 127.0.0.1:6379> lpush list b c (integer) 3 127.0.0.1:6379> object fill factor for individual nodes */ unsigned int compress : 16; /* 压缩深度 0: 不压缩 */ } quicklist; redis.conf -1:4KB;-2:8KB;-3:16KB;-4:32KB;-5:64KB| |list-compress-depth(compress)|压缩深度,默认是0。