首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏用户9757876的专栏

    服务器故障邮件报警

    说到服务器硬件监测,用得最多的自然是Zabbix和prometheus,可是对于一般用户来说,部署要求比较高,而且也没有必要。 只是监测服务器硬件故障,并且发生问题的时候,以邮件形式告警,那么服务器自带的功能就足以。 比如戴尔服务器的idrac,配置硬件故障的邮件告警就非常简单。 如上图所示,首先填写邮件发送服务器的地址,其次就是填写发件人邮件地址,然后就是SMTP端口号,采用SSL协议的话,端口号就填写465;最后填写用户名和密码,就是发件人的邮件账号和密码。 收件人邮件地址,当然也需要填写,不然故障报给谁呢?然后可以“发送”测试邮件,一般都是秒收,如果没收到,就检查SMTP配置。 我比较关注系统运行状况和存储,尤其是存储,重要的数据都在硬盘里面呢,其他硬件故障,相对来说,没那么重要,电源坏了,可以换,内存坏个一两条,也无伤大雅。硬盘要是坏了,那就损失大了。

    1.1K30编辑于 2023-09-06
  • IDC服务器故障排除思路

    2、备件准备硬盘、内存、CPU、主板、电源模块等备件二、常规检查在不拆机、不断电的情况下检查故障服务器1、检查开机状态下服务器指示灯是否正常2、检查有无明显异味、有无明显异响3、检查外观有无明显磕碰、变形等物理损伤 4、检查电源线、电源开关是否正常5、登录BMC系统,查看设备状态和日志,定位故障服务器部件6、在授权可以关机断电的情况下,重启服务器,查看BIOS信息和BMCSEL信息定位服务器故障部件7、如确定为可热插拔的设备造成 如果最小化可以正常开机,再逐步添加其他部件,通过重启服务器来判断是哪个部件故障。2、替换法当大概知道故障范围时,可以通过1-3个部件逐步替换来查找出具体故障,检查故障现象是否有变化,来确认具体故障点。 通过逐一替换服务器内的疑似故障部件,观察故障现象是否消失,以此定位故障部件。可以先替换比较容易出故障的部件,比如硬盘、内存等。 PS:以上方法,不一定单独使用,可以具体情况具体分析,可以灵活组合使用四、主要配件故障排除思路1、CPU故障1.1、无法开机1)查看服务器的BMC log日志,来定位故障CPU位置2)拆机检查故障位置CPU

    2.3K10编辑于 2024-10-06
  • 来自专栏鹅厂网事

    服务器硬盘故障预测实践

    理论上服役时间越长的服务器发生故障的几率也将越大,从腾讯全网服务器的统计结果也表明服务器老龄化的加剧,故障概率会加速上升,特别是使用年份超过4年的设备故障率将出现陡升的情况,显而易见高故障率的老龄化设备将对现网业务造成巨大的影响 我们的服务器使用年限超过5年后,硬盘故障率都是非常高。 ? 于是乎,想快速有效的降低服务器故障的影响,核心就在于降低硬盘故障的影响。 或许这些服务器配置信息能给出一些统计结果,我们想要的是即将故障的硬盘,而不是这些差异性不大的各个集合的整体故障率。 为了支持我们提供了运营模型设置,主要包括服务器类型,上架年限,服务器健康度,业务模块,预测比,坏块比,性能参数等,系统会根据这个设置表,对满足其中任意一条规则的预测故障盘,自动发起故障流程。 部分型号提前天数&预测正确率的趋势参考图9: ? 值得一提的是,刚开始我们把预测单与实际故障单作对比时,效果并不是非常理想。

    14.9K90发布于 2018-02-06
  • 来自专栏技术杂记

    日志服务器9

    安装 LogAnalyzer LogAnalyzer 的下载地址可以参考 下载 ,安装过程可以参考 安装 ---- 下载 LogAnalyzer [root@h105 src]# wget http://download.adiscon.com/loganalyzer/loganalyzer-3.6.6.tar.gz --2016-05-10 22:15:18-- http://download.adiscon.com/loganalyzer/loganalyzer-3.6.6.tar.gz Resolv

    1.2K30发布于 2021-10-20
  • 来自专栏landv

    故障排除和本地开发服务器

    故障排除 以下是一些常见的安装问题,以及建议的解决方法。 仅加载默认页面 如果你发现无论你在URL中放入什么内容,只会加载默认页面,可能是你的服务器不支持提供搜索引擎友好URL所需的REQUEST_URI变量。 本地开发服务器 PHP 提供了一个内置的可以在本地使用进行开发的 Web 服务器,免去了安装如 MAMP,XAMPP 等独立 Web 服务器的需要。 如果你在你的开发机器上安装了 PHP,你可以使用 serve 指令来启动 PHP 的内置服务器,完全安装并用于运行你的 CodeIgniter 应用程序。 :8000 这将启动服务器,并且你可以在浏览器中访问 http://localhost:8000 来查看你的应用程序。

    4.9K10发布于 2020-03-04
  • 来自专栏开源部署

    Linux服务器故障排查基本方案

    服务器架构 服务器系统为Centos7 首先需要知晓系统的对外的架构 一般架构: 1.域名--->云服务器(ECS) 2.域名--->CDN--->云服务器(OSS) 3.域名--->CDN--- >云服务器ECS+数据库RDS+缓存Redis 4.域名--->CDN--->负载均衡--->云服务器ECS+数据库RDS(主从)+缓存Redis 5.域名--->CDN-->WAF防火墙--->负载均衡 --->云服务器ECS+数据库RDS(主从)+缓存Redis 再根据实际情况出现的问题,一步步排查。 客服、市场同事等钉钉、电话报告出现的问题 二、快速定位问题 网络带宽(CDN是否异常) 域名是否解析到源站 登录XXX云CDN后台查看相应流量 负载均衡 检查负载均衡是否正常运行,是否流量异常 应用层服务器 ECS服务器负载是否正常、cpu、内存负载是否过高,硬盘使用率是否达到100%等 缓存服务器 redis服务器负载是否正常、内存使用率如何 数据库服务器 数据库连接数是否正常 列出当前用户的所有连接信息

    1.1K10编辑于 2022-05-27
  • 来自专栏小网管的运维之路

    查看服务器性能及快速故障定位

    查看服务器性能及快速故障定位 适应环境 - Linux 连通性 curl s) print k,s[k]}' #查看当前TCP连接状态;ss更快 ss -an|awk '{print $5}'|awk -F: '{print $1}'|sort|egrep -o '[0-9] {1,3}(\.[0-9]{1,3}){3}'|uniq -c|sort -nr|head -n 10 #查看并发最多的独立IP,取其前10个;sort排序 参数nr中n是按照排序大小,r是反向排序。 ="[04/Apr/2017:12:25:00" && $4 <="[04/Apr/2017:12:26:00"' blog.log #过滤第四列的项,输出大于等于25分,小于等于26分的访问日志 故障定位 -w dst.pcap #过滤出端口为22, 且含有 FIN 标记的数据包 tcpdump -i eth0 -s 0 -l -w out.log port 3306 | strings #在数据库服务器是通过

    1.9K20发布于 2019-05-28
  • 来自专栏luozhiyun的技术学习

    9.源码分析---SOFARPC是如何实现故障剔除的?

    但是有一种情况是Consumer 和 Provider的长连接还在,注册中心未下发摘除,但服务器端由于某些原因,例如长时间的 Full GC, 硬件故障(后文中为避免重复,统一描述为机器假死)等场景,处于假死状态 目前 SOFARPC 5.3.0 以上的版本支持 RPC 单机故障剔除能力。SOFARPC 通过服务权重控制方式来减少异常服务的调用,将更多流量打到正常服务机器上,提高服务可用性。 官方的文档在这里:自动故障剔除 service public static void main(String[] args) { ServerConfig serverConfig = new catch (InterruptedException e) { e.printStackTrace(); } } } 自动故障剔除模块的注册 注册故障剔除模块 我们在8.源码分析---从设计模式中看SOFARPC中的EventBus?

    1.2K20发布于 2019-08-28
  • 来自专栏DotNet 致知

    15_处理服务器故障

    http://mpvideo.qpic.cn/0b78deaagaaaieaoadgjvjpvagodammqaaya.f10002.mp4?dis_k=f6e1009af0e7395ce663923

    1.2K30编辑于 2022-03-29
  • 来自专栏Tacc

    Debian9服务器安装

    1、环境说明:     (1)我的虚拟机是:VMware Workstation 12 Pro      (2)Debian9系统下载   2、系统安装:       至于虚拟机如何配置,这里就不再赘述了 然后点击Continue继续进行安装 你可以在这里给你的服务器起一个名字,默认为debian。 然后选择Continue继续安装 配置你的服务器系统root密码,然后继续安装.使用按键Tab可以切换到其他按钮上去。 选择否,继续安装、 选择否,继续 这里是让你选择安装软件包,如果是服务器的话,就不用安装桌面,直接使用命令行就可以了。可以根据自己的需要进行安装。 然后继续 至此,整个Debian9的安装就完成了,点击Continue系统将会重启。现在系统安装完毕了,但是还不能够访问,将会在下一篇里面教你如何修改接口配置。

    1.8K20编辑于 2022-05-05
  • 来自专栏用户9757876的专栏

    服务器故障、网络故障能提早知道?教你一招搞定

    在多年的IT外包服务过程中发现,一旦客户的网络或者服务器出现故障,如果我们能比客户先知道,并且迅速响应、解决问题,客户的满意度就会非常高。 那么,怎样才能做到服务器故障早知道呢? 在企业的IT基础设施中,服务器的健康状况是至关重要的,特别是Windows服务器,因为它们通常执行关键的业务应用程序。 3.安装过程中,按照提示设置合适的Hostname,填写Zabbix服务器的地址,注意,我习惯用域名来作为服务器地址,这样,当服务器IP变化的时候,就不用修改很多个客户端了,是个省事的好习惯。 随着你对Zabbix功能的深入了解,你将能够更有效地管理和维护你的服务器。 比如,Zabbix可以直接监测服务器的硬件性能,就算是服务器重启一下,也会收到邮件。 虽然不一定知道重启的原因,但是如果这个时候,客户跟你说断网了,你就能回答:“路由器重启中,估计3分钟内恢复网络,如果还是有故障,我们会第一时间处理。” 是不是很酷?想来客户一定会很满意的!

    58410编辑于 2024-05-08
  • 来自专栏网络工程师笔记

    9个网络故障排除经典案例,网工都得会!

    1.8K12编辑于 2024-04-28
  • 来自专栏鹅厂网事

    【鹅厂网事】服务器硬盘故障预测实践

    理论上服役时间越长的服务器发生故障的几率也将越大,从腾讯全网服务器的统计结果也表明服务器老龄化的加剧,故障概率会加速上升,特别是使用年份超过4年的设备故障率将出现陡升的情况,显而易见高故障率的老龄化设备将对现网业务造成巨大的影响 我们的服务器使用年限超过5年后,硬盘故障率都是非常高。 于是乎,想快速有效的降低服务器故障的影响,核心就在于降低硬盘故障的影响。 或许这些服务器配置信息能给出一些统计结果,我们想要的是即将故障的硬盘,而不是这些差异性不大的各个集合的整体故障率。 为了支持我们提供了运营模型设置,主要包括服务器类型,上架年限,服务器健康度,业务模块,预测比,坏块比,性能参数等,系统会根据这个设置表,对满足其中任意一条规则的预测故障盘,自动发起故障流程。 部分型号提前天数&预测正确率的趋势参考图9: 值得一提的是,刚开始我们把预测单与实际故障单作对比时,效果并不是非常理想。

    2.3K10编辑于 2023-03-07
  • 来自专栏【腾讯云开发者】

    一行代码降低i9-13900K故障

    如果你在开发项目里用过 i9-13900K,可能也遭遇过这种情况:程序跑得好好的,突然间就崩了。检查下来,问题竟然出在 CPU 的供电电压波动上。 于是我们决定换个角度——从代码入手,看能否通过分析调试,来降低故障率。这篇文章,就是这次尝试的复盘记录。 关注腾讯云开发者,一手技术干货提前解锁 01、起源 游戏启动编译PSO的时候会偶尔出现崩溃在shader编译或者驱动里面: 02、踩坑过程 在看到设备详细信息后,第一印象就是CPU故障(i9-13900K 的故障率实在太高了),但是在这个机器上多次运行其他游戏以及AIDA64、IPDT等多个测试工具,并没有发现问题,所以首先排除了这方面的可能性, 然后开始了踩坑过程:因为总是崩溃在和dxilconv相关的地方 03、探索降低CPU故障的程序手段 但是,为什么之前运行其他游戏和benchmark不会出现问题? 是不是意味着有方法可以通过程序的手段降低CPU的故障率?

    1K10编辑于 2025-09-11
  • 来自专栏网络安全与可视化

    如何识别服务器连接的零星故障

    通过使用Allegro网络万用表,你可以在几分钟内缩小故障的原因的范围,然后采取措施加以纠正。 首先通过独立于浏览器的web界面搜索用户。 转到概览页面,检查有问题的服务器连接。 这些 “无效连接 “在 “新的TCP连接 “图中显示为蓝色。默认情况下,显示的是当前的服务器连接。如果你放大,时间间隔会扩展到显示过去几个小时。 在某些时间发生的特别多的有问题的服务器连接会立即显现出来。 准确定位有问题的服务器连接 为了更仔细地检查潜在的问题服务器连接,点击一个峰值将时间范围限制在这个时间间隔内。 切换到 “peers “标签,现在你可以看到在有关的时间间隔内联系的服务器。再按 “无效连接 “进行排序,可以立即看到错误最多的服务器(见截图)。 因此,尽管用户信息模糊,你仍然可以在几秒钟内确定受影响的服务器,并使用隔离的网络流量详细检查故障

    94600发布于 2021-06-09
  • 来自专栏计算机主机服务器

    如何避免美国ASP主机服务器崩溃和故障

    ASP主机服务器是一种用于托管网站的服务器,其特点是可靠性高。但是,即使是最可靠的服务器也会遭受故障或崩溃。在本文中,我们将探讨如何避免美国ASP主机服务器故障和崩溃。   一、定期备份数据  定期备份数据可以帮助您在服务器出现故障或崩溃时恢复数据。备份可以存储在本地磁盘或云存储中。您可以使用备份恢复数据,以便在服务器崩溃后能够快速恢复网站。 图片  五、监控服务器  监控服务器可以帮助您及时发现服务器故障和崩溃,并采取必要的措施。您可以使用监控工具来检测服务器性能、网络流量和磁盘空间等方面的问题。 七、使用可靠的硬件  使用可靠的硬件可以帮助您避免服务器故障和崩溃。请选择品牌知名度高的服务器硬件,并确保其质量和性能都是可靠的。   请确保您的服务器和网站都有足够的安全措施来保护您的数据和业务。请确保仅授权的人员可以访问服务器和网站。  在本文中,我们探讨了如何避免美国ASP主机服务器故障和崩溃的九个步骤。

    3.7K20编辑于 2023-04-23
  • 来自专栏jtti

    服务器租用中硬盘故障的常见表现

    硬盘故障可能表现为以下一些常见迹象:1. 异常噪音:硬盘传动异常会导致嘈杂的声音,如咔哒声、嘟嘟声或其他机械运动异常的声音。2. 异常振动:硬盘在正常情况下应该是比较安静的,异常的振动可能暗示着硬盘发生故障。3. 速度变慢:硬盘故障可能导致文件读取或写入速度变慢,整个系统运行速度变得明显缓慢。4. SMART报警:硬盘的自我监测、分析和报告技术(SMART)可能会显示故障预警,提醒硬盘问题。7. 应用程序错误:一些应用程序可能会显示奇怪的错误或无法正常运行,这可能是由于硬盘问题导致的。8. 9. 频繁的读写错误:频繁出现读取或写入错误可能会导致文件操作异常。若您注意到了上述表现中的一项或多项,建议立即备份重要数据,并尽快联系服务提供商或数据中心支持团队,以便诊断和解决硬盘故障问题。

    1.3K20编辑于 2023-11-10
  • 来自专栏工作专用1

    反思一次Exchange服务器运维故障

    公司Exchange邮件系统邮件流故障故障发现、故障处理和故障修复的过程记录和总结反思。帮助自己总结经验和吸取教训,同时也作为一次反面教材让其他运维或管理员吸取教训。 故障发现     昨天下午18点50左右结束团队内培训分享会后,收到同事的反馈,说他们几个人都无法收到外部邮件(Internet上的邮件),故障现象为:Exchange服务器内网收发邮件正常,外网发送正常 故障处理 面临故障最重要的就是尽快通过排除法进行故障排除以实现服务的最快恢复。因此首先要做的故障排除。由于已经是下班时间,事故虽然重大,但还尚未造成重大影响。 此服务器是配置了Zabbix监控报警的,而且Zabbix已经监测到故障并发送报警,由于没有及时的处理才导致本次故障的发生。 就算是接盘也要痛改前非。 虽然有些时候,某些东西偏离了自己的发展方向,但像邮件服务器这样的公司的核心IT系统应该去深入的学习。只有了解和懂得才能遇到问题时更快的解决问题。 每次故障后总结经验和吸取教训。

    3.1K30发布于 2019-03-20
  • 来自专栏Ywrby

    9-web服务器软件概述+Tomcat

    Web服务器软件 服务器概念 安装了服务器软件的计算机 服务器软件概念 接收用户请求,处理请求并做出响应 Web服务器软件概念 服务器软件的一种,在web服务器软件中,可以部署web项目,让用户通过浏览器访问项目 ,又被称为web容器 常见的Java相关的web服务器软件 webLogic:oracle公司的,大型JavaEE服务器,支持所有JavaEE规范,收费。 webSphere:IBM公司,大型JavaEE服务器,支持所有JavaEE规范,收费。 JBOSS:JBOSS公司,大型JavaEE服务器,支持所有JavaEE规范,收费。 Tomcat:Apache基金组织的,中小型JavaEE服务器,仅支持少量的JavaEE规范(如:servlet/jsp)开源免费的 Tomacat 下载:https://tomcat.apache.org

    1.1K20编辑于 2022-10-27
  • 来自专栏云计算教程系列

    使用Debian 9进行初始服务器设置

    介绍 当您第一次创建新的Debian 9服务器时,您应该尽早采取一些配置步骤作为基本设置的一部分。这将提高服务器的安全性和可用性,并为后续操作奠定坚实的基础。 没有服务器的同学可以在这里购买,不过我个人更推荐您使用免费的腾讯云开发者实验室进行试验,学会安装后再购买服务器。 第一步 - 以Root身份登录 要登录服务器,您需要知道服务器的公共IP地址。 默认情况下,在Debian 9上,允许属于sudo组的用户使用该sudo命令。 这样,如果您遇到问题,可以进行故障排除并以root身份进行必要的更改。 为新用户配置SSH访问的过程取决于服务器的root帐户是使用密码还是使用SSH密钥进行身份验证。 ---- 参考文献:《Initial Server Setup with Debian 9

    6.3K50发布于 2018-10-29
领券