作者:杨奇龙网名“北在南方”,资深 DBA,主要负责数据库架构设计和运维平台开发工作,擅长数据库性能调优、故障诊断。 本次分享的一个死锁案例是 涉及通过辅助索引的更新以及通过主键删除导致的死锁。希望能够对想了解死锁的朋友有所帮助。 二 案例分析2.1 业务逻辑select for update 表记录并加上 x 锁,查询数据,做业务逻辑处理,然后删除该记录。还有其他业务逻辑要更新记录,导致死锁。 2.2 环境说明数据库 MySQL 8.0.30 事务隔离级别 REPEATABLE-READcreate table dl(id int auto_increment primary key,c1 另外文章的最后我们再次复习一下 MySQL 的加几个基本原则,方便大家后面遇到死锁案例进行分析:原则 1:加锁的基本单位是 next-key lock。原则 2:查找过程中访问到的对象才会加锁。
作者:杨奇龙网名“北在南方”,资深 DBA,主要负责数据库架构设计和运维平台开发工作,擅长数据库性能调优、故障诊断。 本次分享的死锁案例是 更新不存在的记录加上 X GAP lock 和 insert 的意向锁冲突。希望能够对想了解死锁的朋友有所帮助。 二 案例分析2.1 业务逻辑业务逻辑: 业务需要并发不同数据(insert+update),首先是更新记录,如果发现更新的 affect rows 为0,然后就执行插入,如果插入失败,再执行更新。 null,c3 int not null,unique key uc1(c1),unique key uc2(c2));insert into dl(c1,c2,c3) values(2,0,2),(5,5,5 另外文章的最后我们再次复习一下 MySQL 的加几个基本原则,方便大家后面遇到死锁案例进行分析:原则 1:加锁的基本单位是 next-key lock。原则 2:查找过程中访问到的对象才会加锁。
---- 本文关键字:count、SQL、二级索引 相关文章推荐: 故障分析 | MySQL 优化案例 - 字符集转换 技术分享 | MySQL 监控利器之 Pt-Stalk 一、故事背景 项目组联系我说是有一张 调整部分 MySQL 参数,重启 MySQL,保证目前 innodb buffer pool (内存缓冲区) 中为空,不缓存任何数据; 3. 在测试表 sbtest1 上添加二级索引,索引大小为 55MB; 5. 再次重启 MySQL,保证内存缓冲区为空; 6. 再次执行 select count(*),理论上走二级索引; 7. key_len: 4 ref: NULL rows: 5117616 filtered: 100.00 Extra: Using index 七、案例总结 升级到 MySQL 8 中,使用并行查询,加快检索速度。 当然,什么时候 InnoDB 存储引擎可以直接实现计数器的功能就好了!
作者:胡呈清 爱可生 DBA 团队成员,擅长故障分析、性能优化,个人博客:https://www.jianshu.com/u/a95ec11f67a8,欢迎讨论。 Server 重启了; 2.MySQL MGR 发生切换了; 3.DBA 对 MySQL Server 做了某些变更后。 结论 一开始,在 MySQL Server 上创建应用用户后,手工使用 mysql 客户端对应用用户进行了验证,MySQL Server 缓存了应用用户的验证信息。 之后如果发生以下几种情况: 1.MySQL Server 重启了; 2.MySQL MGR 发生切换了; 3.DBA 对 MySQL Server 做了 flush privileges;。 mysql_native_password。
---- 本文关键字:SQL 优化、字符集 相关文章推荐: 故障分析 | MySQL 派生表优化 故障分析 | 有效解决 MySQL 行锁等待超时问题【建议收藏】 一、背景 开发联系我,说是开发库上有一张视图查询速度很慢 二、问题 SQL Server version: 5.7.24-log MySQL Community Server (GPL) 这个 SQL 非常简单,定义如下,其中就引用了 view_dataquality_analysis SELECT * FROM view_dataquality_analysis WHERE modelguid = '710adae5-1900-4207-9864-d53ee3a81923' 那么基本可以验证我的猜想,当 MySQL 创建视图时,如果发现表连接字段字符集不相同时,会自动添加字符集转换。 另外之前我们有个为什么 b 表没有走索引,是因为缺失了索引吗?的疑问。 其实这个问题有点类似于 int=varchar 隐式转换问题,等号左边为 int 类型,右边为 varchar 类型,那么 MySQL 会自动转换类型为一致,因而无法走索引。
故障现象 MySQL 从库所在主机故障重启后,sql_thread 线程报错: root@3306 (none)> show slave status\G -- 摘取有用信息如下: Slave_IO_Running :88313207'在主机故障前已经在从库进行了回放,那为何事务会重复回放呢? 测试验证 搭建一主一从测试环境,通过 sysbench 模拟主库并发插入,从库主机暴力关机后,故障复现: root@mysql.sock][(none)]> select * from performance_schema.replication_applier_status_by_worker .000012, end_log_pos 1011339749; Could not execute Write_rows event on table sbtest.sbtest5; Duplicate ][(none)]> 5.
1 简介 最近看到了一份收集Kubernetes故障案例的资料,资料由ZalandoTech的高级首席工程师Henning Jacobs加以维护。 k8s.af上的案例由工程师和实施者编写,描述了许多糟糕的经历:比如导致高延迟的CPU限制、阻止自动扩展的IP上限、应用程序日志丢失、pod被终止、502 错误、部署缓慢和生产环境故障等。 PrometheusKube讲述了一个奇怪的故障案例——有一天,某个节点莫名其妙地停止发送日志。工作团队使用fluent-bit来发送日志,注意到Elasticsearch未满足某些请求。 5 负载均衡系统配置错误导致完全中断 生产环境中断、停运、甚至生产环境部分中断都会大大影响用户体验,并抑制业务增长。 原文链接:https://containerjournal.com/editorial-calendar/best-of-2021/how-not-to-use-kubernetes-5-failure-stories
MySQL 建表出现如下错误 (5.7) ERROR 1071 (42000): Specified key was too long; max key length is 3072 bytes查看官网内容得知 innodb_large_prefix is disabled, the index key prefix limit is 767 bytes for tables of any row format. https://dev.mysql.com
案例一 docker启动故障 症状 在执行如下启动命令后docker restart mysql 出现了一下异常报错 docker start mysql Error response from daemon fd91b9c3f3ca2970c9293042b539759c9fb10f4988548d4cc07aaae85278f719: unknown Error: failed to start containers: mysql # 进入如下目录 cd /run/docker/runtime-runc/moby # 执行ls命令可以查看到类似显示 ls 27bc8c9564888782e3aaae0382ba236f83d5b01675aea0a8bfe00083b7177816 fd91b9c3f3ca2970c9293042b539759c9fb10f4988548d4cc07aaae85278f719/ # 删除后重新执行命令,即可启动容器 docker restart mysql
1.故障现象 一套运行快两年的 MGR 三节点多主环境(5.7.25),在节点1成功导入一批数据后,开发反馈程序修改这批数据报错,报错信息如下: update match_equip set name ." 1.1.尝试故障恢复操作1 经过初步分析,发现导入的这批数据,在导入节点1可以更新,在其他节点更新失败,怀疑1节点有问题,本着快速恢复故障原则,询问开发得知1节点可以重启,于是对其进行重启,重启后不能加入组复制 2.2.故障分析 2.2.1.当前 mgr 中 certification_info 有11239426条记录,mgr 每隔60s清理一次,为何会这么大? 2.3.2.故障模拟及恢复 2.3.2.1.当前环境信息:节点3含有本地事务 root@mysql.sock][fxtest]> select * from performance_schema.replication_group_members [root@mysql.sock][fxtest]> 2.3.2.4.故障修复 2.3.2.5.场景1:节点3本地事务对应 binlog 还存在,如何修复 只需重启节点1、2组复制即可同步过来节点3的本地事务
disabled by default because histogram generation for large tables can take a long time. https://dev.mysql.com
问题 原因 故障解决方案 复现步骤 参考文献 一、问题: MySQL5.7.38主从架构,主节点唯一索引上(唯一索引不是主键)有重复值,全部从节点报1062,SQL线程状态异常,根据SQL线程报的binlog 三、故障解决方案: 一、临时解决方案 恢复主从: 在从节点开启会话 set sql_log_bin=0 删除表的唯一索引 重新启动复制线程 缺点是:不能够解决数据重复的问题,切换主从后会面临更多重复数据的问题 innodb_buffer_pool_dump_at_shutdown = 0 5. 重新插入重复唯一索引数据: mysql> set unique_checks=0; mysql> use wl mysql> insert into wl.lgf(id,c,pad) values( id=106121) MySQL :: MySQL 8.0 Reference Manual :: 5.1.8 Server System Variables(https://dev.mysql.com
作者:任坤 现居珠海,先后担任专职 Oracle 和 MySQL DBA,现在主要负责 MySQL、mongoDB 和 Redis 维护工作。 背景 OS:centos 7.9 MySQL:5.7 首次使用某海外云,申请云主机自建 mysql ,service mysqld start 启动报错 Job for mysqld.service # ll ‐ld /data/var drwxr‐xr‐x. 5 mysql mysql 4096 Oct 9 06:14 /data/var # ll /data/var/err.log ‐rw‐r‐ ‐‐‐‐. 1 mysql mysql 33067 Oct 9 06:14 /data/var/err.log service mysqld start 尝试好几次都以失败告终,手工执行 mysqld --defaults-file=/etc/my.cnf 能成功启动,说明 mysql 的配置是正常的,问题应该出现在 OS 系统设置。
作者:任坤 现居珠海,先后担任专职 Oracle 和 MySQL DBA,现在主要负责 MySQL、mongoDB 和 Redis 维护工作。 ---- 1、背景 线上某核心 MySQL ,版本为 5.6,本地机房1主2从,同时部署了一个异地从库。 本文关键字:#从库延迟# #perf# #pstack# ---- 关于SQLE 爱可生开源社区的 SQLE 是一款面向数据库使用者和管理者,支持多场景审核,支持标准化上线流程,原生支持 MySQL 审核且数据库类型可扩展的
1故障现象 某业务 MySQL 实例(MySQL 5.7.20 社区版)发生 Crash,现需要对其具体原因进行分析。 /mysql/mysql-5.7.20/bin/mysqld(my_print_stacktrace+0x35)[0xf468f5] /mysql/mysql-5.7.20/bin/mysqld(handle_fatal_signal +0x29e)[0xe9901e] /mysql/mysql-5.7.20/bin/mysqld(_Z12write_recordP3THDP5TABLEP9COPY_INFOS4_+0x212)[0xe995f2 +0x3a5)[0xd18205] /mysql/mysql-5.7.20/bin/mysqld(_Z16dispatch_commandP3THDPK8COM_DATA19enum_server_command +0x11bf)[0xd1942f] 2故障分析 根据堆栈打印的信息可以得知,当时 Crash 的时间点 MySQL 正在执行 INSERT 操作,且操作涉及 BLOB 数据类型的数据,在源码执行到
其中数据节点 6 整体性能异常, 14:59-15:09 分 cpu 负载100%,内存使用量达到5G。 outflow 带宽增加13倍。
Skype for Business 会议故障案例 Lync/Skype for Business客户端创建会议报错,提示连接服务器错误,严重到“现在开会”选项消失。 查看Skype4B前端服务器事件日志,有大量的错误告警,提示连接后端数据库故障及数据库rtcxds日志已满。 ? 已经有了明确的故障错误,重点排查SQL后端数据库,这里要提一下:很多部署Lync/Skype4B的都没有考虑到后端SQL数据库的管理与维护,以致引起一系统的连锁故障。 收缩数据库日志文件后,Skype4B会议故障消除。 最后,创建数据库维护计划,完整备份数据库、备份事务日志、收缩数据库等一系统常规的计划。
在做实验的时候,写入一行配置到/etc/fstab中去,在做完 lvm实验之后,reboot重启之后,会发现进入不了系统(如下图类似的界面) 本来应该是显示中文,但是在vm终端下,中文不支持,所以看到
虽然MySQL5.7 的主从复制已经很稳定了,但在备库可读写的情况下,总是会出现部分数据不一致的情况,例如常见的1062、1032和1050错误。 环境描述 一 1、mysql 5.7 以上, 2、binlog format 是row格式(5.7默认) 3、传统复制(生产强烈推荐使用gtid) 4、log-bin , log_slave_updates 开启 5、复制结构:101:3306> 103:3306 > 104:3306 常见主从复制报错 二 1、表重复错误: 1050 从库已经有T2表,再在主库上创建T2. .sock 104 导入数据 mysql -S /tmp/mysql3306.sock -uroot -p123456 < /tmp/1203.sql change 104 到103 change -S /tmp/mysql3306.sock -uroot -p123456 -e "insert into enmo.t2 values($i)"done 关闭103 主机,并检查104 slave
Slave_SQL_Running: No解决 1、在从数据库执行slave stop,停掉同步 2、查看主数据库状态 File: mysql-bin.000003 Position: 1151 10.200.11.224′,master_user=’slave_test’, master_password=’123456′, master_port=3306, master_log_file=’mysql-bin