首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏技术杂记

    RabbitMQ 监控9

    Note: 如果不启用 rabbitmq_management 那么在管理界面里是看不到新节点 File descriptors 、Socket descriptors 、 Erlang processes 、 Memory 、 Disk space 、Info 等相关状态的

    38320编辑于 2022-02-09
  • 来自专栏look Java

    # 9 dubbo 监控中心

    9 dubbo 监控中心 我们在开发时,需要知道注册中心都注册了哪些服务,以便我们开发和测试。 图形化显示注册中心的中 服务列表 我们可以通过部署一个 web 应用版的管理中心来实现。 zookeeper 启动 dubbo-server 服务方后,刷新管理端,服务注册成功,只是没有消费者 点击服务名,进入服务提供者页面 把消费者也运行起来,刷新服务,显示正常 查看消费者 2 监控统计中心 -- 让监控 去注册中心 自动找服务 --> <dubbo:monitor protocol="registry"/> 然后重新启动项目 浏览器访问 localhost:8080

    26200编辑于 2023-12-07
  • 来自专栏yeedomliu

    《Prometheus监控实战》第9章 日志监控

    9章 日志监控 虽然我们的主机、服务和应用程序可以生成关键指标和事件,但它们也会生成日志,这些日志可以告诉我们其状态的有用信息 特别是对于没有设置监控或者不容易进行监控的遗留应用程序,有时重写、修补或重构该应用程序以暴露内部状态的成本绝对不是一项有利的工程投资 ,或者还可能存在监控上的技术限制。 但是你仍然需要了解应用程序内部发生的情况,最简单的方法之一是调整日志输出 提示:另一种方法是使用Process exporter查看/proc子系统的内容(https://github.com/ncabatoff P<hostname>[0-9A-Za-z\.:-]+) / + # %h /(?P<remote_logname>[0-9A-Za-z-]+) / + # %l /(? P<remote_username>[0-9A-Za-z-]+) / + # %u /\[(?

    13.8K43发布于 2019-12-19
  • 来自专栏Qt项目实战

    Qt编写安防视频监控系统9-自动隐藏光标

    二、系统介绍 监控系统是由摄像、传输、控制、显示、记录登记5大部分组成。 视频监控系统由实时控制系统、监视系统及管理信息系统组成。 实时控制系统完成实时数据采集处理、存储、反馈的功能;监视系统完成对各个监控点的全天候的监视,能在多操作控制点上切换多路图像;管理信息系统完成各类所需信息的采集、接收、传输、加工、处理,是整个系统的控制核心 视频监控系统是安全防范系统的组成部分,它是一种防范能力较强的综合系统。视频监控以其直观、方便、信息内容丰富而广泛应用于许多场合。 可设置1+4+9+16画面轮询,可设置轮询间隔以及轮询码流类型等,直接在主界面底部工具栏右侧单击启动轮询按钮即可,再次单击停止轮询。 默认超过10秒钟未操作自动隐藏鼠标指针。

    1.9K20发布于 2019-08-21
  • 来自专栏Lambda

    系统监控

    一、为什么监控监控什么内容? 对系统的运行状态了如指掌,有问题及时发现,而不让用户先发现我们系统不能使用。 查看整个系统的的CPU使用率、内存占用、jvm运行情况;以及系统运行出错率等 二、监控的目的 长期趋势分析:比如资源用量预测 对照分析:比如两个版本系统运行资源使用情况差异 告警:当系统出现或者即将出现故障时 ,监控系统需要迅速反应并通知管理员 故障分析与定位:通过对不同监控以及历史数据分析,能快速找到并解决根源问题 数据可视化:通过可视化仪表盘能直接获取系统运行情况、资源使用情况、以及服务运行状态等直观信息 实时数据采集时,最简单的方法就是在系统的入口、出口和关键位置设置埋点,然后将采集到的信息发送到实时监控平台或者存入到缓存和DB中做进一步的分析和展示。 Metrics作为一款监控指标的度量类库,提供了许多工具帮助开发者来完成各项数据的监控

    2.4K20编辑于 2022-09-01
  • 来自专栏知了一笑

    监控平台SkyWalking9入门实践

    简便快速的完成对分布式系统监控; 一、业务背景 微服务作为当前系统架构的主流选型,虽然可以应对复杂的业务场景,但是随着业务扩展,微服务架构本身的复杂度也会膨胀,对于一些核心的业务流程,其请求链路会涉及到多个业务服务 ,并且采集和分析各个环节的数据,这样才能清晰的理解系统的行为信息,比如耗时分析,故障原因发现,从而进行优化和解决;能实现这种能力的组件很多,这里来看看基于SkyWalking9的实践方式; 二、组件原理 Skywalking是APM规范的国产开源分布式链路追踪系统,APM(Application-Performance-Management)即应用性能管理,支持对SpringCloud微服务集成,并且无代码层面的侵入 : 结构体系 业务机制 SpringCloud:分布式系统中的服务,启动时配置代理即可; Agent:以探针的方式进行请求链路的数据采集,并向管理服务上报; OAP-Service:接收数据,完成数据的存储和展示 虽然在整个配置中没有显式的添加对MySQL的监控,但是skywalking依旧可以实现对服务中的数据库监控,对于这些指标细节不过多描述,可以自行查阅文档; 本篇文章只是站在开发的角度,总结skywalking

    1.1K10编辑于 2022-11-30
  • 来自专栏五分钟学SRE

    监控系统开篇

    监控系统简介 监控系统是运维工作中不可或缺的一部分,它可以帮助我们监控系统的健康状况、运行状态和性能指标等,及时发现和解决问题,确保系统的可靠性和稳定性。 SRE对监控系统最基本的需求就是:监控是SRE的第三只眼,使得可以在系统出问题时我们能及时感知到。      监控系统的设计 最基本的监控系统设计,需要考虑以下几个方面: (1)数据收集     数据收集是监控系统的基础,我们需要选择合适的数据收集方式和工具,收集系统的运行数据,如日志、指标数据、事件等,同时还需要考虑数据的存储和管理方式 优秀的开源监控系统 zabbix Zabbix 是一款功能强大的开源监控系统,支持多种监控方式,包括主动采集、被动采集、SNMP、JMX、IPMI 等,擅长设备、网络、中间件的监控。 在选择监控系统时,我们需要根据自己的需求和实际情况来选择最合适的系统

    1.4K100编辑于 2023-11-19
  • 来自专栏五分钟学SRE

    监控系统-OpenTracing

    为了解决架构上带来的troubleshooting的复杂度,演练出常见监控系统主要有三种类型:集中式日志系统(Logging),集中式度量系统(Metrics)和分布式追踪系统(Tracing),这三种分析系统都有各自专注的地方 常见的开源链路跟踪有 Jaeger、Zipkin、Pinpoint、Skywalking 三者的关系图 也是因为三种监控类型系统相对割裂与功能部分重合,对实际的troubleshoot工作其实有一定干扰 ,所以最近也开始流行起了新的监控标准:OpenTelemetry。 不过这后面我们在进行介绍,这次主要介绍下三类监控类型中的Tracing。 SkyWalking可以帮助用户追踪分布式系统中的请求,分析服务之间的依赖关系,以及监控服务的性能指标。

    1.2K10编辑于 2023-12-05
  • 来自专栏devops_k8s

    系统监控体系

    以上问题是在建设监控系统时面临的一些问题,以前我总是想用一个监控产品来实现所有的需求,避免我们在多个产品间来回切换,看来有点舍本逐末。 2 平台化监控思路转变首先,我们先从监控的本质出发:监控系统的目的是为了及时发现问题,解决问题,直至预测问题,不是为了整合系统。 其次,随着公司技术栈的不断升级,业务系统的架构也在不断演进,而原来传统监控可能就不能够满足监控需求。 ;同时需要提供paas集成能力,能够对接和集成外部监控工具和系统。 而我们建立监控系统就是通过场景去发现问题、解决问题、甚至是预测问题。

    66820编辑于 2023-07-21
  • 来自专栏后端

    Prometheus 监控系统

    Prometheus 是一个开源的监控和报警系统,它将我们关心的指标值通过 PULL 的方式获取并存储为时间序列数据。如果单从它的收集功能来讲,我们也可以通过 mysql、redis 等方式实现。 当然,一个完善的系统肯定会衍生出许多组件来支撑它的特性。 外部服务可以是真正的存储系统,也可以是云存储、消息队列等。 总结 系统监控其实是每一个成熟架构都需要考虑的重点,它是基础设施里的重要组成部分,能让我们提前发现问题,解决问题。 而 Prometheus 作为流行的开源监控系统,现在逐渐成为了标准,所以提前熟悉它,使用它,还是大有收益的,毕竟保证业务的稳定性,也是我们开发工作的一部分呢。

    2.1K00编辑于 2022-03-26
  • 来自专栏SRE运维实践

    聊聊监控系统

    1、 为什么需要监控系统 作为运维者,第一个接触的基本上是监控平台,各种各样的监控,看各种各样的指标,好像没有监控就觉得不正常,那么为什么需要监控呢? 监控:预防故障,例如当磁盘空间增长到一定的程度的时候,就会产生故障,这个时候监控系统的作用就是当达到一个阀值的时候,发出告警,然后进行处理。 2、 如何选择监控系统 看过好多监控系统,各种各样的公司使用的监控系统各不一样,有的用nagios,有的用zabbix,有的自研,so much more choice。。。 选择监控系统的时候,无非是需要几个特性的支持: 是否支持多主机监控,例如监控一个分布式系统的集群; 是否支持多维度的数据分析,例如一个主机上有多少个容器,一个主机上容器总共使用了多少内存,每个容器又使用了多少内存 4、 容器的监控 对于一个容器系统,我需要监控哪些指标?

    2.8K41发布于 2019-07-08
  • 来自专栏netservice

    Prometheus监控系统

    监控的目标 在《SRE: Google运维解密》一书中指出,监控系统需要能够有效的支持白盒监控和黑盒监控。 与常见监控系统比较 对于常用的监控系统,如Nagios、Zabbix的用户而言,往往并不能很好的解决上述问题。 这里以Nagios为例,如下图所示是Nagios监控系统的基本架构: Nagios监控系统 Nagios的主要功能是监控服务和主机。 对于基于这类模型的监控系统而言往往存在以下问题: 与业务脱离的监控监控系统获取到的监控指标与业务本身也是一种分离的关系。 对于决策者而言要么你就直接在应用中集成该监控系统的支持,要么就在外部创建单独的服务来适配不同的监控系统

    2.1K20编辑于 2022-04-15
  • 来自专栏开源部署

    Hadoop监控系统

    一、ELLA 监控需求 XMonitor监控系统( svn目录 svn.d.xiaonei.com/Hadoop/Xmonitor) 1 监控展示 NameNode : gc_heap/load/performance gc_heap/rpc/job_status/queue_status HMaster: Monitor: big_job/dead DN,dead TT/clear Log/check Point 2 监控查询

    1.9K10编辑于 2022-06-30
  • 来自专栏大数据-BigData

    Alluxio监控系统

    Alluxio 有一个基于 Coda Hale 指标库的可配置指标系统。 在度量系统中,源生成度量,汇使用这些度量。 度量系统定期轮询源并将度量记录传递给接收器。 指标系统是通过一个配置文件配置的,Alluxio 希望它出现在 {ALLUXIO_HOME}/conf/metrics.properties 中。 以下步骤可以帮助您轻松构建基于 Grafana 和 Prometheus 的 Alluxio 监控。 使用此处的说明安装 Grafana。 worker) alluxio_user The user used to start up Alluxio (eg. alluxio) 如果您的 Grafana 仪表板显示如下面的屏幕截图,则您已成功构建监控 当然,你可以修改JSON文件或者直接在仪表盘上操作来设计你的监控。 JMX监控 您可以通过 jvm_exporter 作为 Java 代理获取 JVM 相关指标。

    4.7K20编辑于 2023-04-03
  • 来自专栏小陈运维

    ​搭建监控系统

    First Frost 搭建监控系统 基本概念 Prometheus Prometheus 是一套开源的系统监控、报警、时间序列数据库的组合,最初有 SoundCloud 开发的,后来随着越来越多公司使用 Alertmanager 主要用于接收 Prometheus 发送的告警信息,它支持丰富的告警通知渠道,例如邮件、微信、钉钉、Slack 等常用沟通工具,而且很容易做到告警信息进行去重,降噪,分组等,是一款很好用的告警通知系统 - files: - "static_conf/*.yaml" refresh_interval: 1s root@cby:~# 进行写入动态配置文件 内容写需要监控的主机即可 system/prometheus.service. root@cby:~# root@cby:~# systemctl status prometheus.service 安装Node_exporter监控组件 +.[0-9]+.[0-9]+).*")) by (kernel)) > 1 for: 6h labels: severity: warning annotations

    4.5K10编辑于 2022-12-20
  • 来自专栏小垃圾的后花园

    Zabbix监控系统

    主要是用来监控系统性能,如:CPU 、内存、硬盘利用率, I/O 负载、网络流量情况等,通过曲线很容易 见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体 性能起到重要作用,目前是监控 HADOOP Api 的支持,方便与其他系统结合 zabbix缺点 需在被监控主机上安装 agent,所有数据都存在数据库里, 产生的数据很大,瓶颈主要在数据库。 +[ \t]+[0-9]+[ \t]+[0-9]+/ {print $1}' UserParameter=Nginx.handled,/usr/bin/curl -s "http://127.0.0.1 :80/nginx-status" | awk '/^[ \t]+[0-9]+[ \t]+[0-9]+[ \t]+[0-9]+/ {print $2}' UserParameter=Nginx.requests ,/usr/bin/curl -s "http://127.0.0.1:80/nginx-status" | awk '/^[ \t]+[0-9]+[ \t]+[0-9]+[ \t]+[0-9]+/ {

    1.7K21编辑于 2023-03-14
  • 来自专栏L宝宝聊IT

    Nagios监控系统

    Nagios是一款开源的免费网络监视工具,可以监控Windows、Linux和Unix的主机状态,交换机路由器等网络设备,在系统或服务状态异常时发出邮件或短信报警,第一时间通知网站运维人员。 流量监控不是他的强项,流量监控建议使用cacti(可以绘制非常直观的图形) 一、nagios主要可以监控以下方面: 主机是否宕机(通过ping命令,如果ping不通会认为主机属于宕机状态,但不影响所监控的其他服务 所有的监控、监测功能都是通过各种插件来完成的。 Libexec:系统默认插件的存储位置 六、配置nagios监控系统 1)nagios的配置文件: Nagios.cfg:主配置文件,定义各种配置文件的名称和位置 Cgi.cfg:控制CGI的配置文件 成功配置出一台nagios监控系统,必须要弄清楚每个配置文件之间依赖与被依赖的关系,最重要的有四点: 定义监控那些主机,主机组,服务和服务组 定义这个监控要用什么命令实现 定义监控的时间段 定义主机或服务器出现问题时要通知的联系人和联系人祖

    2.3K30发布于 2018-06-20
  • 来自专栏网络技术联盟站

    安防监控系统入门——监控系统常用设备介绍

    我们所说的云台区别于照相器材中的云台,照相器材的云台一般来说只是一个三脚架,只能通过手来调节方位;而监控系统所说的云台是通过控制系统在远端可以控制其转动方向的。 [1625453932650-image.png] 3、防护罩   防护罩也是监控系统中最常用的设备之一,主要分为室内和室外两种。 4、监视器  监视器是监控系统的标准输出,有了监视器我们才能观看前端送过来的图像。 另外,有些监视器还有音频输入、S-video输入、RGB分量输入等,除了音频输入监控系统用到外,其余功能大部分用于图像处理工作,在此不作介绍。 9、录像机  监控系统中最常用的记录设备是民用录像机和长延时录像机,因其操作简单易学,录像带也容易保存和购买。

    2.9K20发布于 2021-07-08
  • 来自专栏云原生技术社区

    回答关于Kubernetes 监控9 个问题

    在 Kubernetes 中,你可以监控很多方面,但关键是要明确哪些监控点是至关重要的。 在最近的一次网络研讨会上,我们讨论了在 Kubernetes 平台上应该监控哪些内容、应遵循哪些最佳实践,以及为什么 Kubernetes 监控对于云原生应用开发如此重要。 为什么 Kubernetes 平台中的监控至关重要? 无论是否使用 Kubernetes,监控都是必不可少的。没有监控,你就无法了解应用环境的健康状况,也无法及时发现和解决问题。 监控可以帮助你发现性能下降或资源压力等问题,避免用户体验受损。 8. 有没有备份系统来导出整个集群或一些节点? 开源解决方案 Velero 可以用来备份和恢复 Kubernetes 集群。 9. Datadog 和 Splunk,哪个更适合用于指标监控? 没有固定的推荐,但内部使用 Datadog,它在日志管理和 Kubernetes 指标集成方面表现出色。

    45910编辑于 2024-07-18
  • 来自专栏互联网老辛

    系统监控工具-glances

    作为运维不仅要时时监控系统,还需要优雅的装13,当别人还在命令的小黑框里敲打那个top命令去查看系统性能的时候,我们带你使用web端监控系统性能 glances 是利用Python语言开发,的监控工具, 主要用来监控: ·CPU 使用 率; ·内存 使用 情况; ·内核 统计 信息 和 运行 队列 信息; · 磁盘 I/ O 速度、 传输 和 读/ 写 比率; ·文件 系统 中的 可用 空间; ·磁盘 适配器; ·网络 I/ O 速度、 传输 和 读/ 写 比率; ·页面 空间 和 页面 速度; ·消耗 资源 最多 的 进程; ·计算机 信息 和 系统 资源。 排序; ·m: 按照 内存 使用 状况 对 系统 进程 排序; ·i: 按照 I/ O 使用 状况 对 系统 进程 排序; ·p: 按照 进程 名称 排序; ·d: 显示 或 隐藏 磁盘 读写 状况; ·f: 显示 或 隐藏 文件 系统 信息; ·1: 分开 显示 每个 CPU 的 使用 情况。

    1.1K51发布于 2018-10-18
领券