request 的值并不是指给容器实际分配的资源大小,它仅仅是给调度器看的,调度器会 “观察” 每个节点可以用于分配的资源有多少,也知道每个节点已经被分配了多少资源。被分配资源的大小就是节点上所有 Pod 中定义的容器 request 之和,它可以计算出节点剩余多少资源可以被分配(可分配资源减去已分配的 request 之和)。如果发现节点剩余可分配资源大小比当前要被调度的 Pod 的 reuqest 还小,那么就不会考虑调度到这个节点,反之,才可能调度。所以,如果不配置 request,那么调度器就不能知道节点大概被分配了多少资源出去,调度器得不到准确信息,也就无法做出合理的调度决策,很容易造成调度不合理,有些节点可能很闲,而有些节点可能很忙,甚至 NotReady。
话不多说,开始分享最近在k8s使用和运维上遇到的一些问题和解决经验。 GitCommit:"19e47ee3283ae98139d98460de796c1be1e3975f", GitTreeState:"clean", GoVersion:"go1.13.5"} 三 运维工具 其中,我们通常在持续集成时会使用yaml文件做发布配置,运维时通过命令行操作来执行安装、重启、查看日志等常规操作;而dashboard则是日常观察和问题排查的简单且便捷的方式。 通过dashboard,我们可以查看各service、deployment、pod的健康状况,并在config map中查看已配置参数(运维中很重要,一些服务启动异常,往往是配置有误导致的)。
最近偶尔需要处理一些客户问题,这里记录更新下常用命令 OS tcpdump -i eth0 -s 0 -w s2_s.cap port 3006 strace -T -tt -e trace=all
线上某些系统业务跑一段时间后,日志就会越来越多,考虑到业务机器磁盘有限,需要添加业务日志清理功能。根据日志所在分区磁盘使用情况来判断是否清理日志,比如当日志分区磁盘空间使用超过90%时,将一周前的日志打包转移到别处 (别的分区下或远程存储设备上)。脚本 (/opt/script/log_clear.sh) 如下:
Raid全称” 独立磁盘冗余阵列”, 有时也简称磁盘阵列(Disk Array)。
因为在运维过程中,修改过glance的默认路径由/var/lib/glance/images修改为/data1/glance,并且将/var/lib/glance/images下的镜像都mv至/data1 /glance下了,而此时尽管数据已经前已过去了,但是image的元数据信息却牢牢的记录在glance的image_locations表中,查看得知: mysql> select * from glance.image_locations status: active 1 row in set (0.00 sec) 真像:原来原有目录/var/lib/glance/images目录下的镜像都已经mv至/data1/glance下,而数据库中却依旧记录着就的路径内容
在运维实战中,如果有若干台数据库服务器,想对这些服务器进行同等动作,比如查看它们当前的即时负载情况,查看它们的主机名,分发文件等等,这个时候该怎么办?一个个登陆服务器去操作,太傻帽了! ClusterShell就是这样一种小的集群管理工具,原理是利用ssh,可以说是Linux系统下非常好用的运维利器! 下面是ops-server1服务器上的操作记录: 1)做好主机映射关系,将ip和主机名对应起来,使用比较方便。
描述: 在使用Ansible往往赋予其低权限用户, 假如由于项目需求,需要使用ansible在控制节点以root身份运行playbook,并在playbook中调用其他程序操作/etc下的文件,所以该程序需要使用sudo或者root权限运行,我们应该如何配置。
ssh进入集群节点,telnet 本机的 kubelete 的 服务端口 10250,可以。
一样的部署,在 CentOS 7 上正常,一旦切换到 CentOS Stream 8,就网络异常。具体表现为node->其它节点pod、pod->其它node不通,但是本节点到pod是可以通信的。
e37085e8fb2a49c0921c2d24f5e4f9b5 [root@EXTENV-194-18-2-11 ~]# systemctl restart httpd.service memcached.service 系列文章链接 Openstack运维常见问题记录 (3) Openstack运维常见问题记录(2) Openstack运维常见问题记录(1)
蓝屏是因为当时的镜像打的驱动是virtio的驱动,而磁盘设备所需的是scsi驱动,所以当时的镜像都会蓝屏,后来重制的镜像,磁盘驱动打的是scsi驱动,镜像上传时再加2个参数:hw_disk_bus=scsi,hw_scsi_model=virtio-scsi,后测试没有再蓝屏
'$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" $request_time'; 记录的形式如下 " %>s %b \"%{Referer}i\" \"%{User-Agent}i\" %T " combined CustomLog log/access_log combined 记录的形式如下 10.15.19.138'| awk '{COUNT[$4]++}END{for( a in COUNT) print a,COUNT[a]}' |sort -k 2 -nr|head -n20 nginx转发请求时可以记录响应请求的服务器
Cname与A记录(Address)区别 A记录是解析域名到IP,Cname是解析域名到另外一个域名。 一台服务器可以布置多个网站,也可以有多个域名,如 如域名A----->A记录----->真正的服务器 域名B(也叫A别名) 域名C(也叫A别名) 如果B,C此时也是通过A记录的形式到真正的服务器,那么哪一天真正的服务器修改了
都会进行 DNAT,将原本访问 ClusterIP:Port 的数据包 DNAT 成 Service 的某个 Endpoint (PodIP:Port),然后内核将连接信息插入 conntrack 表以记录连接 # 启动第一个业务进程并记录 pid echo "app1 started with pid $pid1" /bin/app2 & pid2="$!" # 启动第二个业务进程并记录 pid echo "app2 started with pid $pid2" handle_sigterm() { echo "[INFO] Received SIGTERM
即如果一个主机地址同时存在A记录和CNAME记录,则CNAME记录不生效。 3) 删除CNAME记录 点击要删除的CNAME记录后面对应的“删除”按钮即可。 3、MX记录: 邮件交换记录。用于将以该域名为结尾的电子邮件指向对应的邮件服务器以进行处理。 记录优先于A记录。 即,如果一个主机地址同时存在NS记录和A记录,则A记录不生效。这里的NS记录只对子域名生效。 3) 删除NS记录 点击要删除的NS记录后面对应的“删除”按钮即可。
做运维需要考虑的事 简介 /* 运维是在于一个量 最少的人,最多的事 并且保证业务 比如说google的一个数据中心,只有几个人在维护 运维不能直接的创造价值,而是可以变相的节约成本 (7)资产管理 记录和管理运维相关的基础物理信息,包括数据中心、网络、机柜、服务器、ACL、IP等各种资源信息,制定有效的流程,确保信息的准确性;开放API接口,为自动化运维提供数据支持。 运维研发 运维研发负责通用的运维平台设计和研发工作,如:资产管理、监控系统、运维平台、数据权限管理系统等。提供各种API供运维或研发人员使用,封装更高层的自动化运维系统。详细的工作职责如下所述。 (1)运维平台 记录和管理服务及其关联关系,协助运维人员自动化、流程化地完成日常运维操作,包括机器管理、重启、改名、初始化、域名管理、流量切换和故障预案实施等。 任职资格: 1、2018届毕业生,专科及以上学历、计算机相关专业; 2、诚实守信,性格开朗,无不良历史记录; 3、善于学习,善于沟通,文档功底好,勇于面对挑战,敢于承担工作压力; 4、学生干部或有相关网络工程师认证
查询相关日志,分析过程记录如下: redis cluster 集群组成(3主3从,每个节点的数据有6GB,节点机器在同一个内网环境中) 10.0.22.207:7001(971d05cd7b9bb3634ad024e6aac3dff158c52eee
提示glibc版本有问题,然后打算升级,glibc.结果把/lib64/libc.so.6 给替换了,造成Linux ssh无法远程登录,bash命令无法执行。
1 指定Topic指定分区用重新PREFERRED:优先副本策略 进行Leader重选举