我已经成功地将Deis升级到v1.0.1,使用了3个节点集群,每个节点都有2GB的内存,由Digital托管。
然后,我进入了一个deis-store-monitor服务,运行了ceph -s,并意识到它已经进入了active+undersized+degraded状态,永远不会回到active+clean状态。
详细信息如下:
root@deis-2:/# ceph -s
libust[276/276]: Warning: HOME environment variable not set. Disabling LTTng-UST per-user tracing. (in setup_local_apps() at lttng-ust-comm.c:305)
cluster dfa09ba0-66f2-46bb-8d84-12795f281f7d
health HEALTH_WARN 1536 pgs degraded; 1536 pgs stuck unclean; 1536 pgs undersized; recovery 1314/3939 objects degraded (33.359%)
monmap e3: 3 mons at {deis-1=10.132.183.190:6789/0,deis-2=10.132.183.191:6789/0,deis-3=10.132.183.192:6789/0}, election epoch 28, quorum 0,1,2 deis-1,deis-2,deis-3
mdsmap e32: 1/1/1 up {0=deis-1=up:active}, 2 up:standby
osdmap e77: 3 osds: 2 up, 2 in
pgmap v109093: 1536 pgs, 12 pools, 897 MB data, 1313 objects
27342 MB used, 48256 MB / 77175 MB avail
1314/3939 objects degraded (33.359%)
1536 active+undersized+degraded
client io 817 B/s wr, 0 op/s我对卡夫完全陌生。我想知道:
我读过关于Ceph故障排除部分和池、PG和挤压配置引用的文章,但仍然不知道下一步该做什么。
非常感谢!
发布于 2014-11-22 21:42:58
从这个输出:osdmap e77: 3 osds: 2 up, 2 in。听起来你的一个deis-store-daemons没有反应。deisctl restart store-daemon应该恢复您的集群,但是我会好奇这个守护进程发生了什么。我很想在你们所有的主机上看到journalctl --no-pager -u deis-store-daemon。如果您可以将您的日志添加到https://github.com/deis/deis/issues/2520中,这将帮助我们了解为什么守护进程没有响应。
此外,DO上的2GB节点可能会导致性能问题(C年会可能不高兴)。
https://stackoverflow.com/questions/27078160
复制相似问题