print(filename) sftp_down_file(host,port,username,password,filename, "D:/大数据数据/%s"%(n[0])) 执行后自动巡检 /bin/bash #主机信息每日巡检 IPADDR=$(ifconfig eth0|grep 'inet addr'|awk -F '[ :]' '{print $13}') #环境变量PATH没设好 report_NTP="" #NTP ok report_JDK="" #JDK版本 ok function version(){ echo "" echo "" echo "系统巡检脚本 MemPercent=$(awk "BEGIN {if($MemTotal==0){printf 100}else{printf \"%.2f\",$MemUsed*100/$MemTotal ",$2*100/$1}}') inodedata=$(df -iTP | sed '1d' | awk '$2!
为了满足日常工作中的巡检,可以基于Prometheus实现自动巡检,减轻部分运维压力。 效果 数据源管理 (1)添加数据源 (2)数据源列表 巡检项管理 (1)添加巡检项 (2)巡检项列表 标签管理 (1)添加标签 (2)标签列表 任务编排 (1)创建任务编排 (2)任务列表 执行作业 ( 1)创建执行作业 (2)作业列表 巡检报告 每次巡检完成都会生成对应的巡检报告。 (2)当执行时间到了,就会执行ExecuteInspectionJob巡检任务。 另外,在AI发展迅猛的今天,可以把AI也结合到自动化巡检中,比如在巡检中增加一些AI预测,AI故障诊断、AI根因分析等功能。
2. 用户级模板 非管理员用户也能创建个性化模板,灵活应用巡检规则。 对象巡检任务管理:掌控你的巡检节奏 1. 任务配置方式 在添加数据库实例时定义定时巡检任务,选择规则模板,设置周期。 在巡检页面修改任务,支持手动触发,灵活调整策略。 2. 任务执行控制 支持定时自动执行,手动触发,随时调整规则模板。 巡检结果分析:深入洞察数据库状态 1. 结果展示层次 列表视图:展示基本信息,异常,索引数量,最后巡检时间。 详细信息视图:提供完整结果详情,违规项,优化建议。 2. 结果筛选功能 多维度筛选:对象名称、所属模式、违反规则类型。 最佳实践建议:优化你的巡检策略 1. 规则管理建议 根据需求选择规则,避免误报,定期review规则有效性。 为不同数据库类型创建专属模板,定制规则组合,定期更新。 2. 该平台提供丰富的查询重写功能、智能索引推荐以及自动化性能验证,通过语义等价转换和执行计划分析,最大限度提升SQL执行效率。 PawSQL审核平台 - 面向DevOps管控人员,集成完备的审核规
概述 脚本功能功能是全程模拟了人的手工巡检,并收集数据,处理后发送邮件。 将文件中的数据如11%提取部分需要计算出来;创建excel表格,将上一步获取到的数据填写到表格中;编写固定格式的邮件内容,并将保存好的excel表格附到邮件中发送;编写crontab定时任务,实现全程自动化 strip() workbook = xlwt.Workbook(encoding = 'utf-8') cisco = workbook.add_sheet('深圳网络设备巡检 ps:本邮件由系统自动发送,如有任何问题请联系*** Best Wishes 邮件配置 /etc/mail.rc set from=邮箱地址 smtp=邮箱服务器 smtp-auth-user &1 #每周五下午5点巡检 最终效果 ?
#脚本中 ifconfig、mpstat、iostat命令有依赖,需要安装相关依赖包yum -y install bc sysstat net-tools巡检项信息,可根据实际需求修改增加1)、系统基本信息 10排行12)、磁盘io情况13)、系统定时任务列表14)、系统定时任务脚本内容#给巡检脚本授权chmod 755 linux_Inspection.sh#运行脚本. /linux_Inspection.sh#巡检脚本已上传,由于上传不支持sh格式,改为txt#巡检效果#执行完巡检之后,将在脚本所在的路径下生成html巡检结果报告,如下192.168.3.147os_linux_summary.html #巡检效果#若报错syntax error near unexpected token `$'{\r'则转换一下linux格式#! }get_physics(){ name_val "巡检时间" "`date`" name_val "主机名" "`uname -n`" name_val "系统版本" "`cat /
依赖大量人力的传统人工巡检模式,已成为制约业务连续性与运维效率的核心瓶颈,具体表现为:效率低下,耗时费力:逐台登录设备执行命令、记录数据,对200台设备的例行巡检可能耗时长达2小时,挤占了运维人员处理高价值任务的时间 2. 方案概述:志栋智能SAB全流程智能自动化巡检本方案旨在构建一个 “计划-执行-分析-报告-处置” 的全流程闭环自动化巡检体系。 自动化巡检闭环示意图(示意图:自动化巡检“计划-执行-分析-报告-处置”闭环流程)3. 方案核心功能模块模块一:触发式巡检计划与策略中心多维度对象管理:支持按单台设备、设备组或全量设备进行巡检。 模块二:批量自动化执行引擎分布式并行采集:通过部署轻量级采集器或机器人,利用SNMP、SSH、WMI、API等多种协议免登录采集数据,实现数百台设备并行巡检,5分钟内完成以往2小时的工作量。 自动化巡检平台界面示意图(示意图:自动化巡检平台仪表盘、详细报告及流程编排器界面)5.
所以运维自动化巡检就是把对网络、服务器、服务/应用的巡检手动操作转变成自动化的形式。许多情况下运维巡检的自动化也存在诸多问题,以下列出场景的几点供参考。 在做统一巡检时就需要解决网络不通或者要开大量防火墙/网络策略的问题,流程麻烦且安全不好管控。嘉为蓝鲸自动化巡检中心,可以完美解决以上问题乃至巡检中更多的其他问题。 自动化巡检中心可以改变运维人员传统重复手动巡检的工作方式,支持用户自定义巡检脚本和巡检对象,覆盖即时性、周期性等巡检场景,可以根据任务计划实现自动化巡检并生成标准可视化报告,从而减少巡检工作量并提高巡检有效性 脚本支持类型丰富:支持shell、python、bat、powershell等各种类型脚本2. 巡检对象多样:支持操作系统、数据库等所有能通过脚本获取巡检信息的IT对象,可自定义新增扩展性强。3. 通过嘉为蓝鲸自动化巡检中心,可以帮助企业提高巡检效率、降低工作量、减低操作中的人为失误风险。更全面有效的及时发现系统中存在的隐患和问题,提升巡检有效性,保障业务更平稳的运行。
KubeSphere 团队积累了来自社区用户和商业客户三年多的 Kubernetes 集群生产环境运维经验,精通集群组件运行与排查原理,从而开发了一款集群自动巡检工具帮助用户解决集群日常运维的痛点。 KubeEye 是什么 KubeEye 是一款开源的 Kubernetes 集群自动巡检工具,旨在自动检测发现 Kubernetes 上的各种问题,比如应用配置错误、集群组件不健康和节点问题,帮助集群管理员更好地管理集群降低风险 预置检查项 目前已内置支持以下巡检项,未标注的项目正在开发中。 Overlay2 不可用 ✅ NodeKernelNULLPointer node 显示 NotReady ✅ NodeDeadlock 死锁是指两个或两个以上的进程在争夺资源时互相等待的现象。 KubeEye 执行自动巡检: root@node1:# ke diag NODENAME SEVERITY HEARTBEATTIME REASON
#脚本中 ifconfig、mpstat、iostat命令有依赖,需要安装相关依赖包 yum -y install bc sysstat net-tools 巡检项信息,可根据实际需求修改增加 1) 、系统基本信息 2)、cpu信息 3)、ip网络信息 4)、cpu使用率 5)、连接数信息 6)、系统限制信息 7)、内存使用信息 8)、磁盘使用信息 9)、网络流量情况/系统资源变化 10)、cpu消耗情况前 10排行 11)、cpu消耗按内存情况前10排行 12)、磁盘io情况 13)、系统定时任务列表 14)、系统定时任务脚本内容 #给巡检脚本授权 chmod 755 linux_Inspection.sh /linux_Inspection.sh #巡检脚本已上传,由于上传不支持sh格式,改为txt #巡检效果 #执行完巡检之后,将在脚本所在的路径下生成html巡检结果报告,如下 192.168.3.147os_linux_summary.html #巡检效果
一、 前言 1、由于每月月底都需要对一些oracle数据库环境进行一些简单的巡检,而通过运行一条条语句,并依依去截图保存到word文档中效率低下,所以这里我就将手工巡检过程编写成shell脚本来提高巡检效率 2、脚本简单容易二次编辑,本文仅提供简单巡检的事项,如数据表空间是否自动扩展、是否开启归档等,大家根据实际需要编辑修改,增加符合自己公司需求的巡检报告。 ,将在脚本所在的路径下生成html巡检结果报告,如下 192.168.35.244os_oracle_summary.html 4、巡检项信息如下(其他统计项可根据实际需要自行添加) 0)、巡检ip信息 1)、数据库版本 2)、是否开启归档,及归档磁盘占用率与路径信息 3)、数据库memory/sga/pga信息 4)、数据表空间是否自动扩展 5)、数据库当前分配的数据表空间使用率信息 四、脚本内容 ora_sql.sql>>/tmp/tmpora_pga_`date +%y%m%d`.txt } ora_dbfile_info(){ echo "######################## 4.表空间是否自动扩展
#脚本中 ifconfig、mpstat、iostat命令有依赖,需要安装相关依赖包 yum -y install bc sysstat net-tools 巡检项信息,可根据实际需求修改增加 1) 、系统基本信息 2)、cpu信息 3)、ip网络信息 4)、cpu使用率 5)、连接数信息 6)、系统限制信息 7)、内存使用信息 8)、磁盘使用信息 9)、网络流量情况/系统资源变化 10)、cpu消耗情况前 10排行 11)、cpu消耗按内存情况前10排行 12)、磁盘io情况 13)、系统定时任务列表 14)、系统定时任务脚本内容 #给巡检脚本授权 chmod 755 linux_Inspection.sh /linux_Inspection.sh #巡检脚本已上传,由于上传不支持sh格式,改为txt #巡检效果 #执行完巡检之后,将在脚本所在的路径下生成html巡检结果报告,如下 192.168.3.147os_linux_summary.html #巡检效果
没错,这次我结合工作运用场景在现网环境服务器上部署了一个自动巡检多个接口地址是否正常并按 crontab 定时任务通过企业微信机器人以文本的形式发送到告警群的脚本。 /bin/bash #1、北京接口地址 http_beijing_addr=接口地址 #2、xxx企业接口地址 http_xxxqiye_addr=接口地址 # 企业微信机器人地址(需要根据实际机器人地址配置 else echo "$date 北京-接口连接正常" >>/opt/interface-check/interface.log fi #2、 2、新建机器人,填写好机器人名称,保存。 第四步: crontab -e 0 */2 * * * sh /opt/interface-check/jkdz-check.sh 最后,我们可以通过企业微信群查看机器人发送的告警信息,效果如下:
LS-NET-005-DeepSeek自动生成巡检报告 01 测试环境搭建 本次测试环境基于ENSP(Enterprise Network Simulation Platform)构建,测试设备为CE12800 CE2的G1/0/0接口配置IP地址为10.255.255.12。 02 SSH功能配置 **不同厂商的详细配置详见:**如何配置SSH - 去岁千般皆如意,今年万事定称心。 这里仅用ENSP作示例展示 为确保CE1和CE2能够通过SSH进行远程管理,需在设备上执行以下配置脚本: aaa undo local-user policy security-enhance local-user 替换为你的 DeepSeek API 密钥 DEEPSEEK_API_URL = "https://api.deepseek.com" # DeepSeek API 地址 COMMAND_DELAY = 2 f"[{get_timestamp()}] 已清理临时文件") if __name__ == "__main__": main() 脚本执行过程如下: 05 查看报告 运行脚本后,系统将自动生成一份带时间戳的分析报告文件
人工巡检之后,发现设备上有硬盘告警灯。监控软件下又无法查看到系统是JBOD还是做了raid。巡检中,数据库服务器出现硬盘告警,监控软件在这种时候却帮不上忙。 如果不是人工巡检,甚至可能都没有发现这个严重告警。 事例2:某客户的核心业务服务器配置双电源,却在一次电源故障中出现了服务器掉电问题。 带外监控的轮训周期可以达到秒级,而人工巡检的工作量大,以日为周期已经是相当大的巡检密度了。通过带内监控来弥补带外监控的部分空缺,可以极大的提升运维效率,真正意义上实现无需人工巡检。 整个过程只有上架申请和模板库选择模板操作需要人为干预,其它过程均为标准化的自动化流程,可以大大提高部署效率,并减少人为操作带来的上线质量不合格问题。 2.监控/分析 监控分析是DCOS最核心的功能。 通过DCOS的监控、分析功能,可以有效的替代对于小型机、X86服务器、存储设备、备份带库、光纤交换机等设备的人工机房巡检。这种方式大大节省了人工巡检所需的人力,也提高了巡检的效率。
巡检报告通常记录设备的健康状况、运行参数(如温度、湿度、电压、电流等),并标明设备的历史故障及维护建议。与此同时,智能电网中的传感器持续监控设备的实时状态,采集大量数据。2. 二、技术要点:AI如何实现自动化分析与预警1. 信息抽取与自动化分析AI系统通过信息抽取技术自动从巡检报告中提取关键信息,如温度、湿度、电流、电压等设备参数。 2. PDF文档与OCR技术支持巡检报告通常以PDF格式存储,且很多报告是扫描件。AI系统通过OCR(光学字符识别)技术,可以从扫描的PDF文档中准确提取设备数据,并将其转换为结构化信息。 例如,系统可以在短短几分钟内对数百页的巡检报告进行自动分析,并生成设备健康状态的总结报告,为运维人员提供精确、即时的决策支持。2. 实时监控与24小时自动巡检AI系统具备24小时自动巡检与实时监控功能,能够持续跟踪电网设备的运行状态。
1、巡检脚本简介 该套数据库巡检脚本为纯SQL脚本开发,如下所示: 目前一共包含14个脚本,若脚本的扩展名为“.sql”则表示该脚本为sql脚本;若脚本的扩展名为“.pl”则表示该脚本为perl脚本; 全部介绍请参考:https://www.xmmup.com/shujukuxunjianjiaoben.html 2、巡检脚本特点 1、可以巡检Oracle、MySQL、SQL Server、PostgreSQL 、TiDB、openGauss、DB2和国产达梦等8个数据库,也可以巡检Linux操作系统(后续会免费逐步增加MongoDB、OceanBase、PolarDB、TDSQL、GBase、人大金仓等数据库 因为个别巡检命令只支持在服务端运行。 2、该脚本只能对当前的数据库进行检测,若需要检查其它数据库,请重新跑脚本,并修改连接到的数据库名称,例如:db2 connect to test; 4、html巡检结果 这里只列出部分结果,其它的详细内容可以参考
人工巡检之后,发现设备上有硬盘告警灯。监控软件下又无法查看到系统是JBOD还是做了raid。巡检中,数据库服务器出现硬盘告警,监控软件在这种时候却帮不上忙。 如果不是人工巡检,甚至可能都没有发现这个严重告警。 事例2:某客户的核心业务服务器配置双电源,却在一次电源故障中出现了服务器掉电问题。 带外监控的轮训周期可以达到秒级,而人工巡检的工作量大,以日为周期已经是相当大的巡检密度了。通过带内监控来弥补带外监控的部分空缺,可以极大的提升运维效率,真正意义上实现无需人工巡检。 整个过程只有上架申请和模板库选择模板操作需要人为干预,其它过程均为标准化的自动化流程,可以大大提高部署效率,并减少人为操作带来的上线质量不合格问题。 2. 监控/分析 监控分析是DCOS最核心的功能。 通过DCOS的监控、分析功能,可以有效的替代对于小型机、X86服务器、存储设备、备份带库、光纤交换机等设备的人工机房巡检。这种方式大大节省了人工巡检所需的人力,也提高了巡检的效率。
作为一个运维工程师,巡检少不了,如何做一个MySQL的自动巡检脚本(语言不限),最好能提供一些巡检指标、巡检项目、巡检语句的解释、最终的巡检文件等等。 文章末尾有获取shell的巡检脚本和《MySQL数据库巡检报告模板.pdf》的方法。 ON t1.table_schema = t2.TABLE_SCHEMA AND t1.table_name = t2.TABLE_NAME AND t2.CONSTRAINT_NAME IN ( 'PRIMARY ' ) WHERE t2.table_name IS NULL AND t1.TABLE_SCHEMANOT IN ( 'information_schema', 'performance_schema like 'aborted%';开启 binlog 日志binlog 日志开启,能实时记录保存DML 操作show variables like 'log_bin%';binlog 保留天数让mysql 自动清理若干天前的
前段时间在GitHub[1]上发现了一个Ansible巡检服务的Roles, 今天给大家分享一下! 1Ansible自动化实现巡检 思路:通过使用Ansible Role的方式对Linux系统进行资源巡检,生成巡检报告后通过邮件发送给接收人。 2测试的环境 ansible [core 2.12.2] os `Centos 7 X64` python version = 3.10.2 (main, Feb 2 2022, 06:19:27) 使用jinja2模板将获取的数据渲染到模板文件中roles/oss_check/templates/report-cssinline.html,生成的文件存放在指定的目录中。 使用率 < 90, Critical评判条件: 使用率 >= 90 7定期执行扫描 集群节点扫描一般都是主动查看集群运行状态,主观判断的集群节点运行的状态,一般都会在节假日之前进行扫描一次,当然也可以通过自动化工具进行定期扫描
id的使用情况(小心因为自增id使用满了 不能insert写入从而引发报警哦),及主从健康状态的巡检。 1"innodb_buffer_pool_size""sync_binlog"'binlog_format''innodb_flush_log_at_trx_commit''read_only': 2' (不管成不成功)mysql服务器的链接数 临时表 1Created_tmp_disk_tables 2服务器执行语句时,在硬盘上自动创建的临时表的数量,是指在排序时,内存不够用(tmp_table_size 小于需要排序的结果集),所以需要创建基于磁盘的临时表进行排序 3Created_tmp_files 4服务器执行语句时自动创建的内存中的临时表的数量 索引 1Handler_commit 内部交语句 中间件的巡检 mycat && proxysql 这些中间件的巡检,首先参考系统巡检,再看一下中间件本身的日志类和状态类信息,网络延迟或丢包的检查,也是必须要做工作。