首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏k8s技术圈

    使用 Node Exporter 自定义监控指标

    node_exporter 除了本身可以收集系统指标之外,还可以通过 textfile 模块来采集我们自定义监控指标,这对于系统监控提供了更灵活的使用空间,比如我们通过脚本采集的监控数据就可以通过该模块暴露出去 ,用于 Prometheus 进行监控报警。 默认情况下 node_exporter 会启用 textfile 组建,但是需要使用 --collector.textfile.directory 参数设置一个用于采集的路径,所有生成的监控指标将放在该目录下 所有自定义生成的监控指标需要按照如下所示的方式进行存储,比如我们使用 shell 或者 python 脚本写入的文件: # HELP example_metric Metric read from /some systemctl daemon-reload ☸ ➜ systemctl restart node_exporter 这样 node_exporter 就会开始去收集我们指定有的 textfile 目录里面的自定义指标数据了

    4.7K30发布于 2021-11-08
  • 来自专栏腾讯云可观测专栏

    监控最佳实践:自定义监控网络层指标

    如何监控部署在云服务器网络层TCP/UDP连接状态指标? 推荐您使用 云监控-自定义监控 ! 目前内测阶段免费使用,无需审核,开通服务即用。诚邀您点击 申请页面 参与内测体验! ---- 本文介绍如何使用 Shell 命令+SDK 方式上报网络层的关键指标数据至自定义监控,并在自定义监控上查看指标和配置告警。 实践背景 定期监控云服务器上网络层的关键指标,当这些监控指标触发您设置的告警条件时发送短信告警。 前提条件 购买了腾讯云 云服务器 CVM。 [os29rikias.png] 2.进入自定义监控 指标视图 页面,在指标视图右上角选择【···】>【配置告警】。 [kwti7vi0yr.png] 接收告警 如果 Tcp 连接失败数大于0,5分钟后将会收到短信告警,短信内容如下: 【腾讯云】云监控自定义监控指标告警触发 账号 ID:34xxxxxxxx,昵称:自定义监控

    1.8K90发布于 2020-02-28
  • 来自专栏时悦的学习笔记

    使用自定义命令获取Oracle监控指标

    前面介绍了如何利用Python搭建一个网站并且介绍了如何在其中执行Oracle命令并在前端显示出来,这节讲述自定义命令相关的知识 [打造自己的监控系统] Django新建网站的总结 打造自己的监控系统之执行 Oracle命令总结 这个专题主要内容有: 如何新建自定义命令 如何使用自定义命令获取Oracle监控指标并写入数据库 如何将获取到的数据库监控指标在前端显示 ---- 开发环境 操作系统:CentOS 7.3 Python版本 :2.7 Django版本: 1.10.5 操作系统用户:oracle ---- 上节我们介绍了如何新建一个自定义命令 [打造自己的监控系统]让Django运行自定义命令 这节讲述如何使用其获取Oracle监控指标并保存在数据库中 1. 编写自定义命令获取指标并存入数据库 vim oraclemonitor.py ?

    1.2K10发布于 2020-08-19
  • 来自专栏数据和云

    Prometheus+Grafana PG监控部署以及自定义监控指标

    Prometheus是Google监控系统BorgMon类似实现的开源版,整套系统由监控服务、告警服务、时序数据库等几个部分,及周边生态的各种指标收集器(Exporter)组成,是在当下主流的监控告警系统 exporter:广义上向Prometheus提供监控数据的程序都可以成为一个exporter的,一个exporter的实例称为target, exporter来源主要有2个方面:一方面是社区提供的,另一方面是用户自定义的 https://github.com/prometheus-community/postgres_exporter 或者使用以下内容(此内容下载的是git的pg_queries.yaml并添加了一点自己的监控指标 注3:在需要新增监控指标的参数添加时,一定要参照git上的pg_queries.yaml格式进行修改(包括缩进等,最好就是复制原有的再进行修改,postgres_exporter在这里执行的非常严格,最开始配置的时候我在这里调了不少时间 ) 8.新增监控指标: 8.1 在postgres_exporter端的pg_queries.yaml中加入该监控指标的查询SQL 例如: 8.2 在192.168.254.128:9187/metrics

    5.3K21发布于 2021-08-27
  • 来自专栏Tencent Serverless 官方专栏

    云函数 SCF 支持自定义监控 监控指标任你 DIY

    ◆ ◆  ◆ SCF 基础监控指标 在使用云函数时,相信大家都会留意到在控制台展示的函数运行时的监控数据。 希望关注加入购物车的人数、下单购买的人数、最终付款的人数..…… 现在,云函数 SCF 全新升级监控自定义化功能! 用户可以非常简单方便地 DIY 函数运行时想要关注的监控指标,用以监控数据展示和告警! ◆ ◆  ◆ 如何在 SCF 中上报自定义监控指标 步骤1:无需预注册,直接在函数代码里埋点上报自定义监控指标 ? 步骤2:上报完成后,查看指标视图,按需配置告警策略 ? 附录:SCF上报自定义监控数据多方案对比 ?

    2.1K52发布于 2019-12-27
  • 来自专栏无敌码农

    实战|如何优雅地自定义Prometheus监控指标

    我是"无敌码农",今天要和大家分享的是在实际工作中“如何优雅地自定义Prometheus监控指标”! 难道需要在业务代码中编写各种自定义监控指标代码的暴露逻辑吗?接下来的内容我们将通过@注解+AOP的方式来演示如何以更加优雅的方式来实现Prometheus监控指标自定义自定义监控指标配置注解 需要说明的是在Spring Boot应用中,对程序运行信息的收集(如指标、日志),比较常用的方法是通过Spring的AOP代理拦截来实现,但这种拦截程序运行过程的逻辑多少会损耗点系统性能 ,因此在自定义Prometheus监控指标的过程中,可以将是否上报指标的选择权交给开发人员,而从易用性角度来说,可以通过注解的方式实现。 此时在本地启动程序,可以通过访问微服务应用的“/actuator/prometheus”指标采集端点来查看相关指标,如下图所示: 有了这些自定义上报的监控指标,那么Promethues在采集后,我们就可以通过像

    2.5K11发布于 2021-04-14
  • 来自专栏AI大模型

    彻底搞懂监控系统,使用Prometheus监控Spring Boot应用,自定义应用监控指标

    那么接下来我们使用Actuator,Micrometer,Prometheus和Grafana监控Spring Boot应用程序,自定义应用监控指标。 但是,对于核心业务是否也能够监控它们的执行情况呢?答案是肯定的,Micrometer支持自定义监控指标,实现业务方面的数据监控。 接下来,我们以监控所有API请求次数为例,演示如何自定义监控指标并展示到Grafana 。 如上图所示,我们自定义监控指标已经在Prometheus中显示了,说明我们在应用中配置的自定义监控指标已经成功。 以上,我们就把如何自定义监控指标并在Grafana 的图形界面展示介绍完了。 最后 以上,我们就把Prometheus如何监控Spring Boot应用,自定义应用监控指标!介绍完了。

    21.7K53编辑于 2023-03-23
  • 来自专栏腾讯云可观测专栏

    监控最佳实践:自定义监控云数据库MySQL指标

    如何监控云数据库MySQL连接数等运行状态指标 推荐您使用 云监控-自定义监控 ! 目前内测阶段免费使用,无需审核,开通服务即用。诚邀您点击 申请页面 参与内测体验! ---- 本文介绍如何使用 Shell 命令+SDK 方式上报云数据库 MySQL 的指标自定义监控,查看指标并配置告警。 实践背景 定期监控云数据库 MySQL 的关键指标。 输入 Shell 命令,即可完成监控指标数据持续上报。 进入自定义监控 指标视图 页面,在指标视图右上角【配置告警】。 image.png 3. 根据背景需求配置告警规则,更详细的配置操作可参见 配置告警策略。 image.png 接收告警 如果云数据库 MySQL 异常连接数大于0,5分钟后将会收到短信告警,短信内容如下: 【腾讯云】云监控自定义监控指标告警触发 账号 ID:34xxxxxxxx,昵称:自定义监控

    3.4K40发布于 2020-02-13
  • 来自专栏运维开发故事

    k8s应该监控哪些指标及原因

    Kubernetes 每天可以生成数百万个新指标监控集群健康状况最具挑战性的方面之一是筛选哪些指标是重要的,需要收集和关注。 在本文中,我将定义应该监控和创建警报的 16 个关键 Kubernetes 指标。 公司组织的列表可能略有不同,但在制定组织的 Kubernetes 监控策略时,这 16 个是了解k8s集群监控状态最好的指标8Persistent Volume Failures 持久卷是在集群上指定的存储资源,可用作任何请求它的 Pod 的持久存储。 集群事件能监控 pod 生命周期并观察重大的 pod 故障,并且观察从集群流出的事件速率可以是一个很好的早期预警指标。如果事件发生率突然或显着变化,则可能表明出现问题。

    2.1K40发布于 2021-08-13
  • 来自专栏第三方工具

    CAT监控指标

    CAT监控指标 CAT 是基于 Java 开发的实时应用监控平台。 根据Transaction/Event数据分析出来系统可能出现的异常,包括访问较慢的程序等 Heartbeat报表 JVM内部一些状态信息,比如Memory,Thread等 Business报表 业务监控报表 ,比如订单指标。 与Transaction、Event、Problem不同,Business更偏向于宏观上的指标,另外三者偏向于微观代码的执行情况 概述 CAT是需要导包引入的,同时也要手动埋点的,默认有自己的维度, 同时也可以自定义维度,同时CAT带来的损耗肯定是有的,但是官方已经尽量降低损益了。

    65210编辑于 2024-10-09
  • 来自专栏运维之路

    监控体系建设(二):监控指标

    (接监控体系建设(一)监控体系分层与整合) 三、 监控指标 如前一章提到,监控有赖于运维各专业条线协同完善,通过将监控体系进行分层、分类,各专业条线再去有重点的丰富监控指标。 (二)指标权重与阀值分级 在分解具体指标前,需要重点强调一下监控指标指标权重、阀值分级与上升机制问题,做监控的人知道“监”的最重要目标是不漏报,为了不漏报在实际实施过程中会出现监控告警过多的困难。 如何让运维人员在不漏处理监控事件,又能快速解决风险最高的事件,则需要监控指标需要进行指标权重、阀值分级与上升机制: -指标权重: 监控指标的权重是为了定义此项监控指标是否为必须配置,比如应用软件服务 通常来说一级指标将作为监控覆盖面的底线,通过设置好权重,一是为了让运维人员知道哪些监控指标必须确保覆盖,同时加以引入KPI考核;二是为了让监控平台建设人员有侧重的优化,实现一级指标的自动配置,无需运维人员手工配置 这样,就可以将基线做一个监控运行状态的服务,把实际运行的多个监控指标数据关给基线服务,基线服务返回当前服务运行好坏。 监控指标先总结到这。

    5.4K20发布于 2020-03-06
  • 来自专栏CBeann的博客

    在SpringBoot自定义指标并集成Prometheus和Grafana监控

    本文介绍如何使用自定义指标,并使用Prometheus进行监控并报警,同时在 Grafana 进行展现。 看完本文的收益: 主动发现线上问题,而不用被动等客诉,线上问题的概率会变少。 springboot-demo server.port=8082 #将所有Actuator端点暴露 management.endpoints.web.exposure.include=* #启用Prometheus指标导出 * * @param method */ public void incrementMonitorConut(String method) { //定义指标名称 * * @param method */ public void recordMethodRt(String method, Long rt) { //定义指标名称 首先添加一个Prometheus的数据源 然后输入Prometheus的地址,然后选择最下面的Save,没问题后创建面板Dashboard 在面板上选择自定义指标,然后按照顺序点一下,整个图就简单绘制出来了

    2K01编辑于 2024-05-26
  • 来自专栏XBD

    Prometheus监控主机指标

    https://github.com/prometheus/node_exporter/releases 解压后,把node_exporter拷贝到/usr/loca/bin/目录下

    92720编辑于 2022-10-27
  • 来自专栏大数据实战演练

    Elasticsearch集群监控指标

    “本片主要通过两个API讲解Elasticsearch集群监控指标说明” Elasticsearch版本:6.2.4 一、集群健康 一个 剩下来的指标给你列出来集群的状态概要: number_of_nodes和number_of_data_nodes这个命名完全是自描述的,代表ElasticSearch节点数量。 二、集群指标统计 集群统计API可以通过如下命令执行: GET _cluster/stats 1. 这些都是非常有用的指标,不过通常在你的监控技术栈里已经都测量好了。统计值包括下面这些: CPU 负载 内存使用率 Swap 使用率 打开的文件描述符 3. 代表已配置的线程数量 三、参考链接 集群健康:https://www.elastic.co/guide/cn/elasticsearch/guide/current/_cluster_health.html 监控单个节点

    2.2K10发布于 2019-01-20
  • 来自专栏东隅已逝

    Elasticsearch 监控指标解析

    1.集群监控 集群监控主要包括两个方面的内容,分别是集群健康情况和集群的运行状态。 集群健康状态可以通过以下api获取: http://ip:9200/_cluster/health? 2.节点监控 节点监控主要针对各个节点,有很多指标对于保证ES集群的稳定运行非常重要。 可以通过以下api获取: http://ip:9200/_nodes/stats? 一些需要计算的指标: 节点监控的计算指标主要分为两类,分别为请求速率指标和请求处理延迟指标,下面作具体介绍。 1index_per_min: 2#每分钟索引请求数量。 3.索引监控 索引监控指标主要针对单个索引,不过也可以通过“_all”对集群中所有索引进行监控。 节点监控指标可以通过以下api获取: http://ip:9200/_stats? 理解了上面的指标 就可以使用Prometheus和Grafana进行监控展示 下面是我们测试环境的Grafana上展示的Elasticsearch集群的状态 可以看到prometheus采集到的的指标信息还是比较全面的

    2.4K41发布于 2019-12-12
  • 来自专栏陈树义

    树义带你学 Prometheus(七):SpringBoot 实现自定义指标监控

    但是如果我们需要对一些业务指标监控,我们应该怎么做呢?这篇文章就带你一步步实现一个模拟的订单业务指标监控。 假设我们有一个订单系统,我们需要监控它的实时订单总额、10分钟内的下单失败率、请求失败数。 添加业务监控指标 在 spring-web-prometheus-demo 项目的基础上,我们添加一个 PrometheusCustomMonitor 类。 我们可以看到各项指标都有明显的变化,这说明我们的监控生效了! 接着,我们通过配置订单总数、订单总金额、订单数增长率、订单金额增长率这几个图表来实现自定义指标监控。 实现自定义指标监控,有利于我们监控关键的业务指标,从而在线上问题发生之前提前预支问题,最终减少线上问题带来的损失。

    3.3K10发布于 2020-10-27
  • 来自专栏院长运维开发

    K8s基于自定义指标实现自动扩容

    基于自定义指标 除了基于 CPU 和内存来进行自动扩缩容之外,我们还可以根据自定义监控指标来进行。 这个我们就需要使用 Prometheus Adapter,Prometheus 用于监控应用的负载和集群本身的各种指标,Prometheus Adapter 可以帮我们使用 Prometheus 收集的指标并使用它们来制定扩展策略 resources:通过 seriesQuery 查询到的只是指标,如果需要查询某个 Pod 的指标,肯定要将它的名称和所在的命名空间作为指标的标签进行查询,resources 就是将指标的标签和 k8s overrides:它会将指标中的标签和 k8s 资源关联起来。 现在,让我们检查该指标的当前值: [root@prometheus]# kubectl get --raw "/apis/custom.metrics.k8s.io/v1beta1/namespaces

    95710发布于 2020-06-12
  • 来自专栏SY小站的专栏

    k8s基于自定义指标实现自动扩容

    基于自定义指标 除了基于 CPU 和内存来进行自动扩缩容之外,我们还可以根据自定义监控指标来进行。 这个我们就需要使用 Prometheus Adapter,Prometheus 用于监控应用的负载和集群本身的各种指标,Prometheus Adapter 可以帮我们使用 Prometheus 收集的指标并使用它们来制定扩展策略 resources:通过 seriesQuery 查询到的只是指标,如果需要查询某个 Pod 的指标,肯定要将它的名称和所在的命名空间作为指标的标签进行查询,resources 就是将指标的标签和 k8s overrides:它会将指标中的标签和 k8s 资源关联起来。 现在,让我们检查该指标的当前值: [root@prometheus]# kubectl get --raw "/apis/custom.metrics.k8s.io/v1beta1/namespaces

    2.7K100发布于 2020-06-11
  • 来自专栏大数据学习与分享

    监控体系的核心指标

    获得这种洞察力的最佳方法之一是使用强大的监控系统,该系统可以收集指标、可视化数据并在出现问题时提醒操作员。 在我们对指标监控和警报指南的介绍中,我们讨论了一些涉及监控软件和基础设施的核心概念。 指标监控系统处理的主要材料,用于构建被跟踪系统的内聚视图。了解哪些组件值得监控以及您应该查看哪些具体特征是设计一个系统的第一步,该系统可以提供有关您的软件和硬件状态的可靠、可操作的见解。 监控的黄金信号 在极具影响力的 Google SRE(站点可靠性工程)书中,关于监控分布式系统的章节介绍了一个有用的框架,称为监控的四个黄金信号,它代表了在面向用户的系统中要衡量的最重要的因素。 为单个服务器组件收集的指标 需要收集的基本级别指标是与您的系统所依赖的底层计算机相关的指标。 强大的监控可以帮助减轻处理不太可靠的通信渠道的一些困难。 除了网络本身,对于分布式服务,服务器组的健康和性能比应用于任何单个主机的相同措施更重要。

    1.8K30编辑于 2022-07-13
  • 来自专栏SY小站的专栏

    prometheus监控pod相关指标

    背景介绍 临近618了,昨天开发同事来找我,问我为啥看grafana监控,我的服务内存随着压测一直在增长,不释放呢。然后给我看了监控的图。 ? 其实是因为监控pod指标的值用了 container_memory_usage_bytes ,是包含cache的,所以感觉是一直不释放,今天就详细说下这些指标的含义。 2. 容器监控内存相关指标 名称 类型 单位 说明 container_memory_rss gauge 字节数bytes RSS内存,即常驻内存集(Resident Set Size),是分配给进程使用实际物理内存

    8.1K50发布于 2020-06-15
领券