首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >DRBD在10 10GigE上的糟糕同步性能

DRBD在10 10GigE上的糟糕同步性能
EN

Server Fault用户
提问于 2015-12-02 16:21:08
回答 2查看 26.4K关注 0票数 18

我已经设置了一对具有RAID阵列(8核,16 TB,12x2 TB RAID6)和3 10 10GigE接口的相同服务器,以承载一些高可用的服务。

该系统目前正在运行Debian7.9(因为在8.x、稳定或测试中没有cor产c/定时器可用)。

  • 本地磁盘性能约为900 MB/s写,1600 MB/s读。
  • 各机器之间的网络吞吐量超过700 is /S。
  • 通过iSCSI,每台机器都可以以700 MB/s的速度写入对方的存储器。

然而,无论我如何配置DRBD,吞吐量都被限制在100 It /S,看起来确实是一些硬编码的限制。我可以通过调整设置来可靠地降低性能,但它不会超过1Gbit (一次达到122 at /S几秒钟)。我在这件事上真的很紧张。

  • 普通香草核3.18.24 amd64
  • drbd 8.9.2~rc1-1~bpo70+1

配置分为两个文件:global-common.conf

代码语言:javascript
复制
global {
        usage-count no;
}

common {
        handlers {
        }

        startup {
        }

        disk {
                on-io-error             detach;
         #       no-disk-flushes ;
        }
        net {
                max-epoch-size          8192;
                max-buffers             8192;
                sndbuf-size             2097152;
        }
        syncer {
                rate                    4194304k;
                al-extents              6433;
        }
}

cluster.res

代码语言:javascript
复制
resource rd0 {
        protocol C;
        on cl1 {
                device /dev/drbd0;
                disk /dev/sda4;
                address 192.168.42.1:7788;
                meta-disk internal;
        }

        on cl2 {
                device /dev/drbd0;
                disk /dev/sda4;
                address 192.168.42.2:7788;
                meta-disk internal;
        }
}

cat /proc/drbd到从服务器的输出:

代码语言:javascript
复制
version: 8.4.5 (api:1/proto:86-101)
srcversion: EDE19BAA3D4D4A0BEFD8CDE 
 0: cs:SyncTarget ro:Secondary/Secondary ds:Inconsistent/UpToDate C r-----
    ns:0 nr:4462592 dw:4462592 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:16489499884
        [>....................] sync'ed:  0.1% (16103024/16107384)M
        finish: 49:20:03 speed: 92,828 (92,968) want: 102,400 K/sec

主机上的vmstat 2输出(两台机器几乎完全空闲):

代码语言:javascript
复制
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa
 0  0      0 14952768 108712 446108    0    0   213   254   16    9  0  0 100  0
 0  0      0 14952484 108712 446136    0    0     0     4 10063 1361  0  0 99  0
 0  0      0 14952608 108712 446136    0    0     0     4 10057 1356  0  0 99  0
 0  0      0 14952608 108720 446128    0    0     0    10 10063 1352  0  1 99  0
 0  0      0 14951616 108720 446136    0    0     0     6 10175 1417  0  1 99  0
 0  0      0 14951748 108720 446136    0    0     0     4 10172 1426  0  1 99  0

两个服务器之间的iperf输出:

代码语言:javascript
复制
------------------------------------------------------------
Client connecting to cl2, TCP port 5001
TCP window size:  325 KByte (default)
------------------------------------------------------------
[  3] local 192.168.42.1 port 47900 connected with 192.168.42.2 port 5001
[ ID] Interval       Transfer     Bandwidth
[  3]  0.0-10.0 sec  6.87 GBytes  5.90 Gbits/sec

很明显,最初的同步应该有点慢,但不是这么慢.此外,它并没有真正反应任何试图节流同步速率,如drbdadm disk-options --resync-rate=800M all

EN

回答 2

Server Fault用户

回答已采纳

发布于 2015-12-04 14:16:22

其他人建议我使用这些设置:

代码语言:javascript
复制
        disk {
                on-io-error             detach;
                c-plan-ahead 0;
        }
        net {
                max-epoch-size          20000;
                max-buffers             131072;
        }

表演也很出色。

编辑:根据per @Matt Kereczman和其他人的建议,我终于更改为:

代码语言:javascript
复制
disk {
        on-io-error             detach;
        no-disk-flushes ;
        no-disk-barrier;
        c-plan-ahead 0;
        c-fill-target 24M;
        c-min-rate 80M;
        c-max-rate 720M;
} 
net {
        # max-epoch-size          20000;
        max-buffers             36k;
        sndbuf-size            1024k ;
        rcvbuf-size            2048k;
}

再同步速度很高:

代码语言:javascript
复制
cat /proc/drbd
version: 8.4.5 (api:1/proto:86-101)
srcversion: EDE19BAA3D4D4A0BEFD8CDE
 0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r---n-
    ns:133246146 nr:0 dw:2087494 dr:131187797 al:530 bm:0 lo:0 pe:5 ua:106 ap:0 ep:1 wo:d oos:4602377004
        [>....................] sync'ed:  2.8% (4494508/4622592)M
        finish: 1:52:27 speed: 682,064 (646,096) K/sec

使用这些设置(本地写入速度的80%,全线速度),在重同步过程中写入速度是很好的:

代码语言:javascript
复制
# dd if=/dev/zero of=./testdd bs=1M count=20k
20480+0 enregistrements lus
20480+0 enregistrements écrits
21474836480 octets (21 GB) copiés, 29,3731 s, 731 MB/s

阅读速度可以:

代码语言:javascript
复制
# dd if=testdd bs=1M count=20k of=/dev/null
20480+0 enregistrements lus
20480+0 enregistrements écrits
21474836480 octets (21 GB) copiés, 29,4538 s, 729 MB/s

稍后编辑:

完全重新同步后,性能非常好(线速写入,局部速度读取)。重同步速度快(5/6小时),不会对性能造成太大影响(导线速度读数,线速度写入)。我绝对会在零的时候继续做C计划。对于非零值,resync太长了。

票数 10
EN

Server Fault用户

发布于 2016-07-13 06:39:34

C-提前计划必须设置一个正值以启用动态同步速率控制器.磁盘c-plan-ahead 15; // 5 * RTT / 0.1s unit,in my case is 15 c-fill-target 24; c-max-rate 720M;

票数 5
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/740311

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档