
— 特色专栏 —
大家好,我是民工哥!
为什么大厂都在用 Rsync?一文揭秘其底层原理与高可用架构设计!

备份就是把文件在复制一份存放到另一个位置(简单说就是给源文件增加一个副本)以防原始数据丢失或损坏。 备份可以确保在发生数据丢失的情况下,能够迅速恢复数据,降低损失。备份的方法有很多种,其中包括基于文件、快照、binlog日志、集群等。
可以,对于不是特别重要的数据可以不考虑,例如临时文件、日志文件、缓存文件等。
完全备份,(全备,效率低下、占用空间、浪费带宽)

增量备份,(增备,效率较高、节省空间、节省带宽)

备份通常使用什么工具
rsync简称远程同步,可以实现不同主机之间的同步,同时支持增量和全量的备份。
推: 所有主机推送本地数据至Rsync备份服务器,会导致数据同步缓慢(适合少量数据备份)

拉: rsync备份服务端拉取所有主机上的数据,会导致备份服务器开销大

大量服务器备份场景

异地备份场景

Rsync 使用三种主要的数据传输方式
本地传输方式:单个主机本地之间的数据传输(此时类似于cp命令)
本地传输语法:Local: rsync [OPTION...] SRC... [DEST]
本地拷贝数据示例:
[root@backup ~]# rsync -avz /etc/passwd /tmp/
rsync #备份命令(cp)
[options] #选项
SRC... #本地源文件
[DEST] #本地目标文件
远程传输方式:通过ssh通道传输数据,类似scp命令
远程传输语法:
#Pull
rsync [OPTION...] [USER@]HOST:SRC... [DEST]
#Push
rsync [OPTION...] SRC... [USER@]HOST:DEST
Pull拉取数据示例:
# 拉取远程文件
[root@backup ~]# rsync -avz root@172.16.1.31:/etc/hostname ./
# 拉取远程目录下的所有文件
[root@backup ~]# rsync -avz root@172.16.1.31:/root/ /backup/
#拉取远程目录以及目录下的所有文件
[root@backup ~]# rsync -avz root@172.16.1.31:/root /backup/
Pull #拉取, 下载
rsync #备份命令
[options] #选项
[USER@] #目标主机的系统用户
HOST #目主机IP地址或域名
SRC... #目标主机源文件
[DEST] #下载至本地哪个位置
Push 推送数据示例
[root@backup ~]# rsync -avz /backup/2018-10-01 root@172.16.1.31:/tmp/
Push #推送, 上传
rsync #备份命令
[options] #选项
SRC... #本地源文件
[USER@] #目标主机的系统用户
HOST #目主机IP地址或域名
[DEST] #目标对应位置
注意事项:Rsync借助SSH协议同步数据存在的缺陷
守护进程传输方式:rsync自身非常重要的功能(不使用系统用户,更加安全)
守护进程传输语法:
#Pull
rsync [OPTION...] [USER@]HOST::SRC... [DEST]
#Push
rsync [OPTION...] SRC... [USER@]HOST::DEST
Pull拉取数据示例:拉取rsync备份服务的"backup模块"数据至本地/mnt目录
[root@nfs ~]# rsync -avz rsync_backup@172.16.1.21::backup/ /mnt/ --password-file=/etc/rsync.password
rsync #命令
[OPTION...] #选项
[USER@] #远程主机用户(虚拟用户)
HOST:: #远程主机地址
SRC... #远程主机模块(不是目录)
[DEST] #将远程主机数据备份至本地什么位置
push推送数据命令:将本地/mnt目录中的数据推送到备份服务器的backup模块
[root@nfs ~]# rsync -avz /mnt/ rsync_backup@192.172.16.1.21::backup/ --password-file=/etc/rsync.password
rsync #命令
[OPTION...] #选项
SRC... #远程主机模块(不是目录)
[USER@] #远程主机用户(虚拟用户)
HOST:: #远程主机地址
[DEST] #将远程主机模块备份至本地什么位置
-a #归档模式传输, 等于-tropgDl
-v #详细模式输出, 打印速率, 文件数量等
-z #传输时进行压缩以提高效率
-r #递归传输目录及子目录,即目录下得所有目录都同样传输。
-t #保持文件时间信息
-o #保持文件属主信息
-p #保持文件权限
-g #保持文件属组信息
-l #保留软连接
-P #显示同步的过程及传输时的进度等信息
-D #保持设备文件信息
-L #保留软连接指向的目标文件
-e #使用的信道协议,指定替代rsh的shell程序
--exclude=PATTERN #指定排除不需要传输的文件模式
--exclude-from=file #文件名所在的目录文件
--bwlimit=100 #限速传输
--partial #断点续传
--delete #让目标目录和源目录数据保持一致
主机角色 | 外网IP(NAT) | 内网IP(LAN) | 主机名称 |
|---|---|---|---|
Rsync服务端 | 10.0.0.21 | 172.16.1.21 | backup.oldxu.net |
Rsync客户端 | 10.0.0.22 | 172.16.1.22 | nfs.oldxu.net |
[root@backup ~]# yum -y install rsync
[root@backup ~]# cat /etc/rsyncd.conf
uid = rsync
gid = rsync
port = 873
fake super = yes
use chroot = no
max connections = 200
timeout = 600
read only = false
list = false
auth users = rsync_backup
secrets file = /etc/rsync.passwd
log file = /var/log/rsyncd.log
#####################################
[backup]
comment = welcome backup!
path = /backup
配置详解
[root@backup ~]# vim /etc/rsyncd.conf
uid = rsync # 运行进程的用户
gid = rsync # 运行进程的用户组
port = 873 # 监听端口
fake super = yes # 不需要rsync已root身份运行,就可以存储文件的完整属性
use chroot = no # 禁锢推送的数据至某个目录, 不允许跳出该目录
max connections = 200 # 最大连接数
timeout = 600 # 超时时间
ignore errors # 忽略错误的日志信息
read only = false # 对备份数据可读写
list = false # 不允许查看模块信息
auth users = rsync_backup # 定义虚拟用户,作为连接认证用户
secrets file = /etc/rsync.passwd # 定义rsync服务用户连接认证密码文件路径
[backup] # 定义模块信息
comment = commit # 模块注释信息
path = /backup # 定义接收备份数据目录
Rsync服务端进行初始化
rsync账户,不允许登录不创建家目录(用于运行rsync服务的用户身份)rsync用户为属主rsync服务,并将rsync加入开机自启动rsync服务是否正常运行1、创建rsync用户
[root@backup ~]# useradd -M -s /sbin/nologin rsync
2、创建备份目录,然后授权
[root@backup ~]# mkdir /backup
[root@backup ~]# chown -R rsync.rsync /backup/
3、创建虚拟用户密码文件,并授权为600
[root@backup ~]# echo "rsync_backup:sun" >/etc/rsync.passwd
[root@backup ~]# chmod 600 /etc/rsync.passwd
4、配置rsyncd启动停止脚本,然后启动服务(默认没有提供)
[root@backup ~]# /etc/systemd/system/rsyncd.service
[Unit]
Description=fast remote file copy program daemon
After=network.target
[Service]
ExecStart=/usr/bin/rsync --daemon --no-detach
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure
[Install]
WantedBy=multi-user.target
[root@backup ~]# systemctl daemon-reload
[root@backup ~]# systemctl start rsyncd
[root@backup ~]# systemctl enable rsyncd
5、检查服务
[root@backup ~]# netstat -lntp
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name
tcp 0 0 0.0.0.0:873 0.0.0.0:* LISTEN 4758/rsync
Rsync客户端仅需配置虚拟用户的密码,并授权为 600安全权限
方式一:适合终端执行,将虚拟用户密码配置至一个文件中;
[root@nfs ~]# yum install rsync -y
[root@nfs ~]# echo "sun" > /etc/rsync.pass
[root@nfs ~]# chmod 600 /etc/rsync.pass
方式二:适合脚本执行,将虚拟用户密码设定为环境变量;
[root@nfs ~]# yum install rsync -y
[root@nfs ~]# export RSYNC_PASSWORD=sun
1、客户端推送backup目录下所有内容至Rsync服务端
[root@nfs ~]# export RSYNC_PASSWORD=sun
[root@nfs ~]# rsync -avz /backup/ rsync_backup@172.16.1.21::backup/
2、客户端拉取Rsync服务端 backup 模块数据至本地客户端的 /backup 目录
[root@nfs ~]# export RSYNC_PASSWORD=sun
[root@nfs ~]#rsync -avz rsync_backup@172.16.1.21::backup /backup/
Rsync实现本地数据与远程数据无差异同步
1、拉取远端数据:远端与本地保持一致,远端没有本地有会被删除, 造成客户端数据丢失
[root@nfs ~]# export RSYNC_PASSWORD=sun
[root@nfs ~]# rsync -avz --delete rsync_backup@172.16.1.21::backup/ /data/
2、推送数据至远端:本地与远端保持一致, 本地没有远端会被删除, 造成服务器端数据丢失
[root@nfs ~]# export RSYNC_PASSWORD=sun
[root@nfs ~]# rsync -avz --delete /data/ rsync_backup@172.16.1.21::backup/
故障案例: 某DBA使用rsync拉取备份数据时,由于文件过大导致内部交换机带宽被沾满,导致用户的请求无法响应;
[root@nfs ~]# export RSYNC_PASSWORD=oldxu
# 单位MB
[root@nfs ~]# rsync -avz --bwlimit=1 rsync_backup@172.16.1.31::backup/ /data/
rsync,rsync_backup,是否存在关系;

以上内容来源:https://blog.csdn.net/Sunfeiyanghtml/article/ details/140007999
回到文章开头的最初问题,大厂之所以都在用它,是因为 Rsync 其高效的数据同步能力、灵活的同步模式、可靠的数据传输保障、支持自动化操作以及广泛的适用场景等强大功能。
Rsync采用增量传输算法,只传输源目录和目标目录之间有差异的部分,而非全量复制。这一特性极大地减少了数据传输量,提高了同步效率,尤其适合处理大型文件库或频繁更新的数据。
Rsync支持多种同步模式,包括本地目录同步、远程SSH同步以及通过rsync守护进程的高效传输。这种灵活性使得Rsync能够适应不同的网络环境和同步需求,无论是内网环境还是跨地域的数据中心,都能实现高效的数据同步。
Rsync在传输过程中会检测文件的完整性,通过校验和来验证文件是否正确传输。同时,它还能保留文件的权限、时间戳、符号链接等属性,确保数据的准确性和一致性。
Rsync可以与定时任务工具(如crontab)结合,实现自动化同步。这对于需要定期备份或同步数据的场景非常有用,能够大大减轻运维人员的工作负担。
Rsync在服务器备份、数据迁移、文件分发、网站部署等多种场景中都有广泛应用。大厂通常拥有复杂的IT架构和大量的数据,Rsync的这些特性使得它成为处理这些任务的理想选择。
#备份 #数据备份 #数据恢复 #数据同步 #同步软件 #开源软件 #全量备份 #增量备份 #Rsync #高可用架构 #科技 #IT运维 #软件工具 #Linux运维
👍 如果你喜欢这篇文章,请点赞并分享给你的朋友!