我在使用kolla-ansible部署的相对较小的openstack集群上遇到了问题。问题是控制器在几天后停止工作。当我进入docker容器日志时,我看到所有的日志中都有太多的Open Files。我已经尝试更改进程和用户的limits.conf sysctl max文件。在所有这些之后,问题仍然出现了。
有趣的是,直到我必须重启所有控制器时,才会发生这种情况。我重启了它们,因为我需要在它们交换时死后增加它们拥有的内存。我的第一个想法是kolla-ansible在运行deploy之后设置了一个配置,但当kolla-ansible更改ulimits或其他时,我似乎找不到任何存储库中的任何点。
有什么可能导致这种情况的理论吗?这会不会与增加内存有关?我应该在每个控制器上运行重新配置/部署吗?我试着在kolla-ansible的文档和论坛中寻找,但没有看到其他人有这个问题。
更新这个问题还没有修复:我提交了一个bug报告https://bugs.launchpad.net/kolla-ansible/+bug/1901898
发布于 2021-01-08 20:56:51
这是修复了bug中的https://bugs.launchpad.net/keystonemiddleware/+bug/1883659问题,中子服务器保持memcached连接打开,并且直到memcached容器达到太多打开的文件时才关闭它们。在bug链接中提到了一种变通方法。
发布于 2020-10-21 19:17:01
我不知道你用过的Kolla-Ansible版本和你的Linux,但你的问题似乎真的与这个有关:
On Ubuntu 16.04, please uninstall lxd and lxc packages. (An issue exists with cgroup mounts, mounts exponentially increasing when restarting container) (来源: docs.openstack.org/kolla-ansible/4.0.0/quickstart.html)
在重新启动我的docker-container之后,我也遇到了这个问题,因为挂载指针的数量呈指数级增长。基于这个问题,我的单节点测试部署变得非常慢,但我不记得在打开太多文件时也会出现同样的错误。
您可以使用apt-get remove lxc-common lxcfs lxd lxd-client删除包。我已经完成了这个修复,并完全重新安装了kolla-ansible安装,所以我不知道这是否对已经存在的安装也有帮助。你也应该使用docker-ce而不是apt-repos中的docker。
https://stackoverflow.com/questions/64445803
复制相似问题