首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏若尘的技术专栏

    私有与K8S对比

    managerundefined主要包括mdo-manager服务、etcd集群、Prometheus、Altermanager、Grafana监控告警系统、Ntp server时间同步组件、Nginx agentundefined主要包括mdo-monitor自定义监控组件、mdo-ctl、Ntp Client、Node Exporter等。 k8s-components.png 从架构上来看MDO和k8s基本一致,如果k8s加监控告警也基本上使用prometheus+altermanager+exporter三件套,时钟同步也会用ntp server 逻辑概念,k8s并不真实存在pod。 文档在地化undefined对于一个项目文档的重要性不言而喻,尤其对于像MDO这种toB的私有,不同的版本,文档会有变动,靠内部wiki等记录文档是不好的。

    2.4K45编辑于 2021-12-07
  • 来自专栏大数据技术博文

    Kafka监控系统对比

    本文对比了如下几个kafka监控工具: Kafka Manager Kafka center Kafka Eagle kafka-monitor kafdrop 一 : Kafka Eagle 提供异常告警功能,支持微信、邮件、钉钉 8. 支持权限,角色的管理 9. 提供了大屏展示 BScreen 优点: 1. 代码简单,配置灵活 2. 社区活跃度高, 代码commit 频率高 3. 监控多个集群状态、breaker、control等信息 2. 提供了kafka connector 功能 (实际内嵌了 kafka-connect-ui ) 3. 提供监控告警模块可以查看topic的生产以及消费情况,同时可以对于消费延迟情况设置告警 5. 可以创建Connect Job 以及 KSQL Job , 并提供维护功能 6. li-apache-kafka-clients)结合使用,用于监视单个集群、管道设计集群和其他类型的集群,如Linkedin工程中用于实时集群健康检查的集群 linkedin 开源 最新版本:2.1.5 发布时间:2020年04月8

    2.3K20编辑于 2022-04-18
  • 来自专栏IT运维技术圈

    常见监控工具分析对比

    运维行业有句话:“无监控、不运维”,是的,一点也不夸张,监控俗称“第三只眼”。没了监控,什么基础运维,业务运维都是“瞎子”。 所以说监控是运维这个职业的根本。 对比图 2.统一运维监控平台设计思路 运维监控平台不是简单的下载一个开源工具,然后搭建起来就行了,它需要根据监控的环境和特点进行各种整合和二次开发,以达到与自己的需求完全吻合的程度。 : 1>监控内容分类:由于要监控的机器很多,监控内容也随之增多,于是我们将监控根据用途不同,进行了分类,主要分为系统基础监控数据、网络监控数据和业务监控数据。 2>全覆盖式监控:将所有机器均纳入监控中,主要包含软件监控和硬件监控,硬件监控主要是监控硬件性能和故障,软件监控除了第一步提到的各种基础监控数据外,还增加了业务逻辑监控,尽可能的覆盖业务流程,通过大量自定义监控减少和去除重复的问题 自从发生监控系统宕机事故后,我们对监控服务器进行了分布式高可用部署,以避免单点故障,同时对监控到的数据进行远程异地备份,当监控服务器故障后,会自动切换到备用监控系统上,并且监控数据自动保存同步。

    1.7K40编辑于 2023-02-02
  • 来自专栏分布式存储

    ceph开源监控软件对比

    介绍 目前主流的Ceph开源监控软件有:Calamari、VSM、Inkscope、Ceph-Dash、Zabbix等,下面简单介绍下各个开源组件。 2. 开源软件对比 2.1 Calamari Calamari对外提供了十分漂亮的Web管理和监控界面,以及一套改进的REST API接口(不同于Ceph自身的REST API),在一定程度上简化了Ceph的管理 优点: 管理功能好 界面友好 可以利用它来部署Ceph和监控Ceph 缺点: 非官方 依赖OpenStack某些包 2.3 Inkscope Inkscope 是一个 Ceph 的管理和监控系统,依赖于 Ceph 提供的 API,使用 MongoDB 来存储实时的监控数据和历史信息。 优点: 易部署 轻量级 灵活(可以自定义开发功能) 缺点: 监控选项少 缺乏Ceph管理功能 2.4 Ceph-Dash Ceph-Dash 是用 Python 开发的一个Ceph的监控面板,用来监控

    3.1K20发布于 2020-07-20
  • 来自专栏技术杂记

    RabbitMQ 监控8

    3.5.6-gite309de4 [ ] mochiweb 2.7.0-rmq3.5.6-git680dba8 3.5.6-gite309de4 [e*] mochiweb 2.7.0-rmq3.5.6-git680dba8

    30310编辑于 2022-02-09
  • 来自专栏技术派

    探针、监控项目

    开始安装 1.更新gcc,因为gcc版本太老会导致新版本python包编译不成功,已安装php环境请忽略

    5.4K10发布于 2021-06-28
  • 监控入门

    监控入门 原文作者:Angela Stringfellow 原文地址:https://dzone.com/articles/a-cloud-monitoring-prime 监控是评估、监控和管理基于的服务 许多公司利用各种应用程序监视工具来监视基于的应用程序。下面我们来看看监控的运行机制和成功的实践。 要监控服务类型 有多种类型的服务要监控监控不仅仅是监控AWS或Azure上托管的服务器。 但是,监控对基本的服务器监控工具有一些独特的要求。 监控如何运行 “”这个术语是指一组网络托管的应用程序,通过网络对数据进行存储和访问,而不是通过计算机的硬盘。 监控的好处 利用监控工具的主要优势包括: 已经有了基础设施和配置。安装快速简单。 专用工具由主机维护,包括硬件。 这些解决方案适用于各种规模的机构。 其他的资源和教程 如果想获得更多的信息和建议,请访问以下资源: 监控与服务器监控不同的6个原因 监控工具和最佳实践指南 监控您不拥有的基础设施的4个最佳实践 设计和实现治理:治理是新兴的能力

    9.8K110发布于 2018-01-10
  • 监控入门

    监控是一个对基于的服务、应用程序与基础架构进行评估、监控与管理的工作。公司利用各种应用程序监控工具来监视基于的应用程序。下面我们来看看它是如何工作的,以及使用它走向成功的必经之路。 监控的类型 有多种类型的服务要监控监控不仅要监控像在AWS或Azure上托管的服务器。对于企业来说,他们最关心的还是监控他们正在使用的服务(如微软的Office 365等)。 然而,监控的出现又对这些基础的监控工具提出了新的独特要求。 监控的工作方式 “”是指一组网络托管的应用程序。与传统的程序不同,这些程序并不通过硬盘,而是通过Internet存储和访问数据。 监控通过一系列工具去监控服务器本身及其资源用量,以及正在其上执行任务的应用。这些工具通常来自于两方面: 服务提供商自带 - 其最大的特点就是简单,因为这些工具就是服务的一部分。 这使得相关单位可以从任何可以访问Internet的位置监控这些应用程序和服务。 实现监控 任何相关的企业和公司都需要将监视作为优先事项并对其进行长远规划。

    9.3K70发布于 2018-01-08
  • 来自专栏腾讯云可观测专栏

    “战疫”:8天扩容100万核,我们这样做好监控

    平台本身技术强大,许多海内外皆知的外部视频平台皆基于腾讯视频搭建,腾讯带宽早已于去年突破百T峰值量级。 笔者有幸参与了腾讯的这次“战疫”工作,监控系统有效地支撑了几大应用场景。 同时工程上我们做了一些场景导入,我们开发了“监控助手” 移动端。方便用户自行一键订阅、退订指标。获得了较好的告警触达准确性。避免告警过多骚扰。 对于海量用户反馈分析,此方法相对比较有效。 较为常见的处理方式是: 产品增加投诉入口,用户的反馈通过接口上报至指定位置。 将投诉信息分词,分词方法很多,不再详述。 监控的本质是数据,如何利用这些数据,及时发现业务问题、有效诊断业务问题,是监控的关键目的所在。 服务用户是我们的最终目的,文中提及的各种技术,会随着腾讯监控能力逐步向外界用户开放使用。 欢迎大家关注腾讯监控

    75810发布于 2020-03-26
  • 来自专栏哈利哥

    监控监控升级与优化

    监控业务主要部署在腾讯TKE上,共部署了40多个地域,80多个TKE集群,1700多个Node节点,1万多个Pod。 由于TKE集群需要业务维护Node节点,出于成本的考虑,监控逐渐把TKE集群迁移至EKS集群,中间经历了自监控的升级与优化,对于自监控建设有一定的参考意义,通过文章记录下来。 (备注:本文所描述的自监控指metric类监控,不涉及log与tracing) 1、迁移引发的问题 - 自监控不可用了 监控的自监控主要是业务程序使用Prometheus SDK通过export的方式进行上报 因为监控中台存储支持类influxQL的查询语法,因此可以用Grafana配置InfluxDB数据源进行面板展示。 TKE与EKS对比 2、自监控升级 既然DaemonSet不能使用,那么Agent能否使用Deployment方式部署呢?

    4.6K20编辑于 2022-11-22
  • 来自专栏Windows技术交流

    如何修复监控

    监控异常的常见原因有:监控组件对应的2个服务BaradAgentSvc、StargateSvc 未安装完整,比如漏了其中1个。或者是更改了默认dns导致内网域名解析有问题进而影响了数据上报。 修复监控的基本顺序是:查看dns是否能正常解析内网域名,如果不能请调整dns使能,然后卸载监控组件,参考官网文档重装组件。 1、如何卸载监控组件有两种办法 ①管理员身份打开powershell执行如下命令 sc.exe stop BaradAgentSvc 2>$null 1>$null sc.exe config BaradAgentSvc 、镜异常等 https://cloud.tencent.com/developer/article/1878648 这里要特别注意,如果C:\Program Files\QCloud\Stargate 3、重新安装监控组件的话参考官网文档 https://cloud.tencent.com/document/product/248/6211

    6.2K20编辑于 2024-12-16
  • 来自专栏yeedomliu

    《Prometheus监控实战》第8监控应用程序

    8监控应用程序 首先,考虑的一些高级设计模式和原则 ---- 8.1 应用程序监控入门 应用程序开发中存在一种常见的反模式,即把监控和其他运维功能(如安全性)视为应用程序的增值组件而非核心功能。 但监控(和安全性)应该是应用程序的核心功能。如果你要为应用程序构建规范或用户故事,则请把对应用程序每个组件的监控包含进去。 不构建指标或监控将存在严重的业务和运营风险,这将导致 无法识别或诊断故障 无法衡量应用程序的运行性能 无法衡量应用程序或组件的业务指标以及成功与否,例如跟踪销售数据或交易价值 另一种常见的反模式是监控力度不足 ,我们始终建议你尽全力监控应用程序。 ,这样就可以对监控和指标进行分区 8.1.1 从哪里开始 开始为应用添加监控,一个不错的选择是程序的入口和出口。

    6.6K11发布于 2019-12-19
  • 来自专栏腾讯云原生团队

    监控 Barad 的原生实践

    赵轩,高级运维工程师, 腾讯监控业务运维负责人。 腾讯监控的 Barad 产品,为产品提供高效、低成本的海量指标监控服务。 Barad 业务上面临的难点和挑战 在降本增效的大背景下,腾讯 监控团队继续提升原生成熟度,提升系统承载能力和降低单位成本,包括对 Barad 业务在容器化占比提升,跨 az 容灾能力建设,资源利用率优化这些方面 在使用 TKE 部署中业务同学需要保障在迁移过程中的数据稳定上报,因为 Barad 作为腾讯基础监控业务,任何的改动都可能造成用户的监控数据丢失或断点,针对这个情况,Barad 在部署业务时多次进行小地域验证 这些节点都是小机型(2U4G和4U8G)然而这些节点的数量和集群规模没有关系,每个集群至少都要这么些管控节点。(5个2U4G,6个4U8G) 而 TKE 集群的管控节点固定为3台(4U8G)。 Barad原生实践总结 监控 Barad 业务经历了为期半年的原生渗透率提升,跨 az 容灾能力建设,资源利用率优化这些优化动作之后,原生成熟度增长明显,且业务稳定性有了大幅提升。

    6.1K42编辑于 2023-02-16
  • MYSQL8 索引监控视图

    索引维护是一项永无止境的任务,不要认为在建表的定好了就不需要在管它了,随着表结构,查询,数据内容变化都是需要重新考虑之前的索引是否能正确运行,是否高效.

    27610编辑于 2024-12-25
  • 来自专栏人称T客

    公有与私有优劣对比分析

    私有 私有是一个公司使用的特定环境。不同于公有模式中共享的设施使用,私有模式中每个公司使用的服务器或存储应用都是单独的。 私有有两种不同的模式。 其一,公司在自己的数据中心中建立的私有。 管理复杂性: 使用私有时,公司必须处理内部的所有事务,而在公有云中,这些事务将由服务商来解决。因此,公司必须独自进行自己内部私有云中的配置,部署,监控和设备保护等一系列的工作。 此外,他们还需要购买和运行用来管理,监控和保护环境的软件。 混合 众所周知,混合是将单个或多个私有云和单个或多个公有结合为一体的环境。这样用户可以同时回避公有云和私有的劣势。 而且,公司还需要对员工进行培训,以确保他们可以在混合环境中进行建立,集成,管理,监控和保护等一系列的工作任务。

    20.2K80发布于 2018-03-23
  • 2026主流运维监控平台深度对比,谁能适配全栈监控需求?

    本文聚焦应用较为广泛的五款主流产品,从核心定位、能力亮点、适用场景三维度展开对比,为企业选型提供实战参考。01. 运维监控产品核心能力全景对比1)Lerwee核心定位:国内全栈智能监控与信创合规佼佼者,专为中大型企业异构环境打造“采集-分析-告警-处置”全流程闭环平台,聚焦国产化场景下的全栈观测与业务连续性保障;相对开源产品 适用场景:采用容器、微服务、原生架构的企业;具备开源技术栈开发与维护能力的技术团队;对时序指标分析与可视化有高要求的互联网、科技企业;适合作为原生架构下的核心监控组件,搭配其他工具构建全栈观测体系。 能力亮点:• 全栈SaaS化观测:无需自建监控基础设施,通过Agent一键部署实现全球分布式环境的监控覆盖,支持公有(AWS、Azure、阿里等)、私有、混合等多种架构,实现“一套平台管全域”。 其原生原生适配优势明显,时序数据处理性能优异,开源生态完善,可灵活搭建贴合原生架构的监控体系;但需注意其全栈观测能力需额外集成工具实现,搭建与维护需要专业技术团队支撑,缺乏官方商业化服务。

    33910编辑于 2026-03-12
  • 来自专栏有文化的技术人

    聊聊原生监控模式

    Prometheus Prometheus是在微服务和容器化的过程中兴起,算是当前监控领域的经典,尤其是与K8s的搭配也是成为了原生体系组件的事实标准。 作为原生计算基金会 (CNCF) 的孵化项目,OpenTelemetry旨在提供与供应商无关的统一库和 API 集——主要用于收集数据并将其传输到某个地方。 A7%84%E8%8C%83%E9%98%85%E8%AF%BB/ 从上面可以看出,各个监控平台或多或少都提供了push和pull模式的监控方式,下面来分析下两种方式的区别 工作原理 原理对比 Pull 能力对比 能力对比 PULL PUSH 监控对象存活性 简单 无法区分 数据齐全度计算 可行 较困难 短生命周期(Job,Serverles)实时性高 难以适用 适用 指标获取灵活性 固定,方便分享,可按需获取 成本对比 成本对比 Pull Push 资源消耗 1. 应用暴露端口方式 低2. Exporter方式 较高 3.占用端口资源 1.应用推送 消耗低2.

    1.1K20编辑于 2023-09-20
  • 来自专栏腾讯云容器运维

    原生监控通过blackbox_exporter监控网站

    ,blackbox_exporter允许通过HTTP,HTTPS,DNS,TCP和ICMP对端点进行黑盒探测,由于我们的服务都是在腾讯上,prometheus也是用的上托管,叫做原生监控,但是原生监控并没有提供网站站点的监控 首先这里你要有原生监控实例并且关联你的tke集群,这里就不细说原生监控的创建和tke集群的部署使用了。 我们直接说如何在tke部署blackbox_exporter,然后通过原生监控来采集数据,最后在grafann里面通过dashboard来查看监控原生监控配置RawJobs采集数据 image.png image.png 进入原生监控找到你关联集群,点击数据采集配置,然后再RawJobs里面新增一个jobs,job配置如下,如果需要监控多个站点可以配置多个 9965号 image.png image.png 这里选择下我们配置的job image.png 然后就可以查看我们的站点监控了 image.png 到这里我们用原生监控监控我们的站点就完成了,如果想了解更多

    5.2K40发布于 2021-04-02
  • 流计算与数据质量监控:五大主流工具深度对比及腾讯Oceanus推荐

    本文将解析当前主流流计算平台的数据质量监控能力,并重点推荐腾讯流计算Oceanus的解决方案。 一、主流流计算工具对比 以下从核心能力、数据质量监控功能、适用场景等维度,对比五大主流流计算平台: 工具名称 核心能力 、实时分析 按处理量计费 腾讯流计算Oceanus 亚秒级延迟、弹性资源池、细粒度监控 内置 70+质量监控指标,支持AI动态阈值告警、异常数据隔离、全链路血缘追踪 电商实时风控、游戏反作弊 包年包月/按量付费 二、腾讯流计算Oceanus的核心优势 1. 对于追求降本增效的企业,Oceanus的弹性资源策略和智能监控体系,配合腾讯生态的协同能力,已成为实时数据治理的最佳实践之一。

    18110编辑于 2026-02-10
  • 来自专栏腾讯云可观测专栏

    监控新手入门

    02 “腾讯云云监控是一项可对产品资源进行实时监控和告警的服务。 监控为用户提供了统一监控 服务器、数据库 等产品的平台。 您可以通过使用监控全面了解产品资源使用率、应用程序性能和产品运行状况,监控还支持多指标监控、自定义告警、跨地域和跨项目实例分组、自定义监控可视化 Dashboard 等功能。 让您无需额外开发,即可全面掌控产品资源使用、运行情况。您可以前往 监控控制台、监控 API 或 腾讯 CLI 了解监控,获取相关监控数据。” --摘自腾讯监控官网文档 简单说,各产品都会有一些指标来衡量它的运行情况,用户可以通过监控的能力对这些指标可视化展示,实时监控,及时了解产品监控状态。 以上都是一些关于监控在对产品监控上的基础应用,用户还可以通过监控的其它功能达到更个性化的监控告警能力,为业务服务。

    3.1K30发布于 2020-04-15
领券