tcp) failed: Cannot assign requested address 实验2:相同目标 ip 不同目标端口 $ nohup nc 123.125.114.144 443 -v & [3] 123.125.114.144 443 -v nc: connect to 123.125.114.144 port 443 (tcp) failed: Cannot assign requested address 实验3:
话不多说,开始分享最近在k8s使用和运维上遇到的一些问题和解决经验。 linux/amd64"} Server Version: version.Info{Major:"1", Minor:"16", GitVersion:"v1.16.3", GitCommit:"b3cbbae08ec52a7fc73d334838e18d17e8512749 GitCommit:"19e47ee3283ae98139d98460de796c1be1e3975f", GitTreeState:"clean", GoVersion:"go1.13.5"} 三 运维工具 其中,我们通常在持续集成时会使用yaml文件做发布配置,运维时通过命令行操作来执行安装、重启、查看日志等常规操作;而dashboard则是日常观察和问题排查的简单且便捷的方式。 通过dashboard,我们可以查看各service、deployment、pod的健康状况,并在config map中查看已配置参数(运维中很重要,一些服务启动异常,往往是配置有误导致的)。
最近偶尔需要处理一些客户问题,这里记录更新下常用命令 OS tcpdump -i eth0 -s 0 -w s2_s.cap port 3006 strace -T -tt -e trace=all ~ $$^pg_$$ and nspname<>$$information_schema$$ group by 1,2,3,4 order by 5 desc; -- 库空间 select datname relfrozenxid) age_remain from pg_authid t1 join pg_class t2 on t1.oid=t2.relowner join pg_namespace t3 on t2.relnamespace=t3.oid where t2.relkind in ($$t$$,$$r$$) order by age(relfrozenxid) desc limit 5; $12" , "$13" , "$14}'|sort|uniq -c|sort -rn ## 慢日志分析,非常实用 cat *.csv|awk -F "," '{print $1" "$2" "$3"
根据系统/服务/日志保留天数三个参数压缩日志 #usage: sh clearlog.sh sysname appname keepdays sysName=$1 appName=$2 keepDay=$3
Topic的消费kafka-console-consumer.sh More 日常运维 、问题排查 怎么能够少了滴滴开源的 滴滴开源LogiKM一站式Kafka监控与管控平台 1.Topic的发送 默认值) –max-partition-memory-bytes Long 为分区分配的缓冲区大小 16384 –message-send-max-retries Integer 最大的重试发送次数 3 bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --whitelist ‘.*’ --from-beginning 3. kafka.tools.NoOpMessageFormatter、kafka.tools.ChecksumMessageFormatter More Kafka专栏持续更新中…(源码、原理、实战、运维
由于在一个硬盘阵列中,多于一个硬盘同时出现故障率的几率很小,所以一般情况下,使用RAID3,安全性是可以得到保障的。 RAID 3结构图解 与RAID0相比,RAID3在读写速度方面相对较慢。 53应该称为RAID 30或RAID 03(也可以说是RAID 0+3),即RAID 3与RAID 0的组合,具体形式见图:与图1相对比,可以发现,RAID 53中将备份等级由RAID 0变为了RAID 3,也就是说把原来的镜像阵列变成了分割式(Segments)存储阵列。 但它不是对每个RAID 0硬盘都用一个RAID 3系统进行,而是用RAID 3对所有数据进行冗余存储(或者说是校验),而且读写与ECC效率比RAID 0要高不少。 值得注意的是,RAID 3在RAID 53的数据传输中占有相当重要的位置。在介绍RAID 3时,曾说过它有很高的读写传输率。
| {} | 1 | RegionOne | | 476654c6e7dd4d22b290de451e3afda0 | NULL | admin | ①.把 rabbitmq 的集群的rabbitmq节点2 和节点3 由disc模式改为ram 模式。 ②把rabbitmq 压力分散到3个rabbitmq节点。 因为在运维过程中,修改过glance的默认路径由/var/lib/glance/images修改为/data1/glance,并且将/var/lib/glance/images下的镜像都mv至/data1 /glance下了,而此时尽管数据已经前已过去了,但是image的元数据信息却牢牢的记录在glance的image_locations表中,查看得知: mysql> select * from glance.image_locations status: active 1 row in set (0.00 sec) 真像:原来原有目录/var/lib/glance/images目录下的镜像都已经mv至/data1/glance下,而数据库中却依旧记录着就的路径内容
在运维实战中,如果有若干台数据库服务器,想对这些服务器进行同等动作,比如查看它们当前的即时负载情况,查看它们的主机名,分发文件等等,这个时候该怎么办?一个个登陆服务器去操作,太傻帽了! ClusterShell就是这样一种小的集群管理工具,原理是利用ssh,可以说是Linux系统下非常好用的运维利器! 下面是ops-server1服务器上的操作记录: 1)做好主机映射关系,将ip和主机名对应起来,使用比较方便。 [root@ops-server3 clustershell]# ssh ops-server3 The authenticity of host 'ops-server2 (192.168.1.118 --------------- ops-server2 --------------- ops-server3 --------------- ops-server3 ---------------
crontab -e 编辑任务计划 crontab -l(小写的L) 列出任务计划 crontab -r 删除 crontab -u [username] 指定某个用户 1-5 表示范围1到5 1,2,3 --level 34 network off/on 控制network的等级3和4开关 --add [servicename] 增加一行服务,前提是在/etc/init.d/目录下有文件 --del [
)查看IP($1代表IP) #cat access_log | awk '{print $1}' (2)对IP排序 #cat access_log | awk '{print $1}'| sort (3) awk '{print $1}'|uniq -c|wc -l > ip.txt (13)查看 access.Log 文件ip统计(从高到低) cat access.log |awk '{print $3} (3) 端口不通时发送邮件 # vim /scripts/ncports.sh #! /bin/bash #denyhost ip cat /var/log/secure|egrep -i -o "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3 > $fileRfc done tail /sys/class/net/eth*/queues/rx-*/{rps_cpus,rps_flow_cnt} 补充一些知识: Linux运维常见系统服务介绍
Topic的消费kafka-console-consumer.sh 3. 持续批量推送消息kafka-verifiable-producer.sh 4. 持续批量拉取消息kafka-verifiable-consumer More 日常运维 、问题排查 怎么能够少了滴滴开源的 滴滴开源LogiKM一站式Kafka监控与管控平台 1.Topic的发送 默认值) –max-partition-memory-bytes Long 为分区分配的缓冲区大小 16384 –message-send-max-retries Integer 最大的重试发送次数 3 bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --whitelist ‘.*’ --from-beginning 3. 唯一值 --max-messages 单次最大消费的消息数量 --enable-autocommit 是否开启offset自动提交;默认为false --reset-policy 当以前没有消费记录时
与其他用户的ssh连接认证】 ssh-keygen # 2.拷贝ssh公钥到被控制机器节点 ssh-copy-id -i ~/.ssh/id_rsa.pub weiyigeek@xx.xx.xx.xx # 3.
一样的部署,在 CentOS 7 上正常,一旦切换到 CentOS Stream 8,就网络异常。具体表现为node->其它节点pod、pod->其它node不通,但是本节点到pod是可以通信的。
kube-system calicoctl -- /calicoctl " 新增一个IP pool calicoctl create -f -<<EOF apiVersion: projectcalico.org/v3 get ippool -o yaml > pool.yaml vim pool.yaml , 修改或新增:disabled: true apiVersion: projectcalico.org/v3
其中镜像文件be32a717ae7ea3aa039131689864a325fd634c92是没有被使用的镜像文件。 等待一段时间,文件没有变化。 40分钟,设定值247小时,现在改成5秒,3秒。 7db14191536e - - - - -] Active base files: /var/lib/nova/instances/_base/0522bc602608d45758d815b01a6899ff3e1e3e27 e37085e8fb2a49c0921c2d24f5e4f9b5 [root@EXTENV-194-18-2-11 ~]# systemctl restart httpd.service memcached.service 系列文章链接 Openstack运维常见问题记录 (3) Openstack运维常见问题记录(2) Openstack运维常见问题记录(1)
'$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" $request_time'; 记录的形式如下 " %>s %b \"%{Referer}i\" \"%{User-Agent}i\" %T " combined CustomLog log/access_log combined 记录的形式如下 .png 4 /group1/M00/00/00/wKgKylqTsFCAdeEuAAKHUIZ3K9s287.png 3 /group2/M00/00/00/wKgKy1qUtu2Acai1AAKHUIZ3K9s555 .jpg 2 /favicon.ico 1 /group2/M00/00/00/wKgKy1qT3P-Ae-vQAAKHUIZ3K9s459.png 1 /group2/M00/00/00/wKgKy1qT3P-Ae-vQAAKHUIZ3K9s459 10.15.19.138'| awk '{COUNT[$4]++}END{for( a in COUNT) print a,COUNT[a]}' |sort -k 2 -nr|head -n20 nginx转发请求时可以记录响应请求的服务器
对策: 规范命名规则,一千台计算节点以内用 XXXX-HOST-YYYY034,数字编号统一为3位。 修改高可用组件代码,调用novaclient代码时候加上strict参数。
Cname与A记录(Address)区别 A记录是解析域名到IP,Cname是解析域名到另外一个域名。 一台服务器可以布置多个网站,也可以有多个域名,如 如域名A----->A记录----->真正的服务器 域名B(也叫A别名) 域名C(也叫A别名) 如果B,C此时也是通过A记录的形式到真正的服务器,那么哪一天真正的服务器修改了
都会进行 DNAT,将原本访问 ClusterIP:Port 的数据包 DNAT 成 Service 的某个 Endpoint (PodIP:Port),然后内核将连接信息插入 conntrack 表以记录连接 # 启动第一个业务进程并记录 pid echo "app1 started with pid $pid1" /bin/app2 & pid2="$!" # 启动第二个业务进程并记录 pid echo "app2 started with pid $pid2" handle_sigterm() { echo "[INFO] Received SIGTERM
dd if=infile.log of=outfile.log bs=1M count=1