首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏云原生应用工坊

    观测平台-3: 应用系统监控项

    在讨论以容器应用为视角的监控和告警时,有几个关键点需要注意。首先,传统的基于主机资源的监控方法(如使用率和负载监控)可能不再适用于动态、多副本的Pod环境。这是因为在容器化和微服务架构中,应用服务的动态性和弹性更加突出。

    71820编辑于 2023-12-13
  • 来自专栏SpringBoot教程

    SpringBoot3 整合Prometheus + Grafana,实现可观测

    通过Prometheus + Grafana对线上应用进行观测、监控、预警...健康状况【组件状态、存活状态】Health运行指标【cpu、内存、垃圾回收、吞吐量、响应成功率...】Metrics... endpoints: enabled-by-default: true #暴露所有端点信息 web: exposure: include: '*' #以web方式暴露3. 应用到服务器确保可以访问到部署好的服务,http://192.168.254.129:8080/actuator/prometheus图片http://192.168.254.129:8080/actuator图片3.

    3K40编辑于 2023-08-03
  • 来自专栏重归混沌

    谈谈观测

    随着这几年我对 eBPF、Prometheus 等工具的深入了解,我才逐渐意识到“可观测性”这个词背后蕴含的意义。 很早以前,我就在 Linux 上使用 /proc/、top、sar 等工具来排查问题,却从未意识到,“观测”竟然是一门独立的学问。 这也正是“可观测性”弥足珍贵的原因之一:当系统出问题时,我们可以通过系统本身提供的可观测能力,去追踪和理解到底发生了什么。 不得不佩服 Linux 的设计者们,/proc 文件系统的设计在多年以前就已体现出极强的可观测性理念。 我并不想讲怎么样实现可观测性,毕竟我不是专家。 但我想谈谈观测给了我们一个什么样的视角。 这从侧面也说明了,当我们通过观测来排查问题时,并不需要一上来就去了解整个系统的实现细节,从宏观视角就可以排查很多问题。 这一点很重要,前面铺垫了这么多,都是为了这个观点。

    9210编辑于 2026-03-25
  • 来自专栏初代庄主

    观测 CPU

    背景 通常在分析性能问题时,我们会用 `top , sar , perf` 来观测 CPU 的使用情况;多数据情况下是观测别人的程序。 如果从熟悉工具的角度来看,观测自己的程序,根据观测到的结果再结合程序源代码,对于我们掌握性能分析工具会更有帮助。 for(;;) { // 不断的查询父进程的 pid ,这个会占用 sys 空间 getppid(); } } ---- sar 看 cpu 的使用率 要观测所有 0.00 99.80 平均时间: 2 0.00 0.00 0.99 0.00 0.00 99.01 平均时间: 3 stackcollapse-perf.pl perf-script.log > stackcollapse-perf.log flamegraph.pl stackcollapse-perf.log >hello001-cpu.svg 3

    56140编辑于 2022-05-17
  • 来自专栏深度学习与python

    作业帮服务观测之基础观测能力

    Smart, twisty narratives – nonlinear or slowly-unfolding storytelling that rewards close attention. 3. 图 3:序列图说明现代基于 AI 的系统中负责任的模式 输出防护栏模式 即使你什么都做对了,模型仍然可能产生错误、有偏见或有害的内容。你需要防护栏!它们是在模型生成输出后应用的规则、检查或干预措施。

    24710编辑于 2025-06-08
  • 来自专栏云云众生s

    Web3应用的可观测性有何不同

    然而,这种新范式给 应用程序性能监控 和可观测性带来了挑战。让我们探讨如何使用 Scout APM 在基于 Django 的 Web3 应用程序中实现可观测性的主要支柱——日志记录、指标 和 跟踪。 去中心化应用程序中的可观测性有何不同? Web3 dApp 中的可观测性提出了几个需要解决的独特挑战。 不可变交易 Web3 dApp 严重依赖区块链技术。 强大的 Web3观测性解决方案的基本功能 鉴于 Web3 环境带来的独特挑战,显然传统的可观测性解决方案可能不够用。需要一种更高级的解决方案来解决这些痛点。 自定义可观测性解决方案 Web3 仍处于起步阶段,并且正在迅速发展。鉴于这种日新月异的变化速度,你需要一个允许自定义的可观测性解决方案。 用于 Web3观测性的 Scout APM 与 Django Scout APM 是你可以用于你的 web3 dApp 的可观测性解决方案。

    31310编辑于 2024-03-28
  • 来自专栏运维有术

    3 大体系 × 3 层指标:Milvus 全链路可观测监控搭建指南

    # 确认 CRD 已创建kubectl get crd | grep prometheus3. 3. Alloy 是 Grafana 生态中的新一代可观测性收集器,基于 OpenTelemetry Collector 构建,可以同时处理 metrics、logs、traces 三类信号。 Q3:Loki 日志查询很慢怎么办?A:Loki 的查询性能和标签索引有关。确保查询时至少包含一个标签(如 {namespace="default"}),避免全量扫描。 三个体系搭建完成后,你的 Milvus 就从裸奔状态变成了全面可观测。建议收藏这篇教程,下次搭建监控环境时直接翻出来跟着做。

    17410编辑于 2026-04-29
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    AMSR-EAqua L1A 原始观测次数,第 3

    AMSR-E/Aqua L1A Raw Observation Counts, Version 3 简介 改进后的 V003 AMSREL1A 产品对共同登记参数 A1 和 A2 进行了经验修正,并更新了用于修正 AMSR-E/Aqua L1A原始观测数据是由AMSR-E仪器收集的原始微波辐射观测数据。这些数据包括来自AMSR-E的各种微波频段的亮温观测值。 这些数据没有进行任何校正或处理,包含了仪器观测到的原始辐射信息。 6.9 GHz 至 36.5 GHz 频道在地球表面的采样间隔为 10 公里,89.0 GHz 频道为 5 公里。 AMSR-E 1A 级观测计数由日本宇宙航空研究开发机构(JAXA)地球观测中心(EOC)根据 0 级科学数据包数据进行处理。 AMSR-E/Aqua L1A Raw Observation Counts, Version 3 [Data Set]. Boulder, Colorado USA.

    29110编辑于 2024-06-28
  • 2025企业可观测产品选型实战指南:可观测是什么?可观测平台怎么选?

    选择一款适配自身架构的可观测平台,成为企业保障业务连续性、降低运维成本的关键。本文先厘清可观测的核心定义与价值,再通过3款可观测平台的深度对比,结合实战选型逻辑,助力企业精准落地可观测能力。 3)SolarWindsNPM核心定位网络性能专项可观测平台,聚焦多厂商网络设备管理与链路性能监控,主打“网络数据深度分析+拓扑可视化”。 特色能力监控2000+种网络设备,支持SNMPv3协议与NetFlow分析,适配华为、Cisco、H3C等多厂商设备,链路故障定位精度达99%;采用专利采样技术,网络流量采集对带宽影响低于1%,支持WAN 3)按行业合规要求选型金融/政务/能源(信创+合规):嘉为蓝鲸(信创认证+合规适配,数据安全可控);互联网企业(云原生+快速部署):腾讯云TCOP(云生态联动+部署高效);运营商/园区(网络专项+多厂商 Q3:网络架构复杂的企业,能否同时使用SolarWindsNPM与嘉为蓝鲸?A:可以,且推荐组合使用。

    33810编辑于 2025-11-19
  • 蓝鲸观测平台:统一观测数据关联模型探索

    前 言本文为蓝鲸观测平台数据模块负责人 在 蓝鲸智云 和 DeepFlow 社区 合办的第六场 eBPF 零侵扰可观测性 Meetup 上的演讲,原来题为根因定位关键:统一观测数据关联模型探索概 述根因分析高度依赖可关联的观测数据 第一部分是在可观测出现之前,我称之为传统监控以及现在经常说的可观测。传统监控和可观测的区别,其实我总结下来可能就是两个不一样的地方,一个是被动,一个是主动。什么叫被动呢? 第二部分就是我们蓝鲸观测平台已经做了好几年了,在这几年的过程中,我们基于整个观测场景搭建了那么一套观测体系,有常见的三大支柱,我们现在加了一根第四根支柱,就是事件那块,像指标、Logs、Trace 等等 如果这个模型不是一个时序的,只是一个实时的,现在这个时候就已经不存在所谓的观测的意义了。所有的观测,都是当下以及未来,甚至以前都是需要在观测整个体系里面去表现的。 原视频链接:https://www.bilibili.com/video/BV1ZJ46eiE3S/?

    99110编辑于 2024-09-27
  • 来自专栏charlieroro

    Istio可观测

    Istio可观测性 Istio的可观测性包括metrics,日志,分布式链路跟踪以及可视化展示。 目录 Istio可观测性 Prometheus 配置说明 Option 1:合并metrics Option 2:自定义抓取metrics配置 TLS设置 总结 Jaeger 概述 跟踪上下文的传递 使用 为了实现上述目的,应用需要在传入请求中收集并传递如下首部到任何传出请求中: x-request-id x-b3-traceid x-b3-spanid x-b3-parentspanid x-b3-sampled 将reviews-v1设置为30%,reviews-v2设置为0%,将reviews-v3设置为70%。 ? 点击Create创建该路由。 name: v3 点击左边导航栏的Graph按钮返回到bookinfo图表 向bookinfo应用发送请求。

    3.2K20发布于 2020-09-07
  • 来自专栏云原生技术呱呱

    观测建设总结

    一 可观测架构1 可观测数据处理架构设计流水日志日志index以及检索(es)监控指标(组件模调+业务指标)告警指标(参考监控指标,分别划分不同场景的阈值+告警级别+处置方法=sla)处理架构选型推荐开源 2 系统可观测白盒:描绘出系统架构,以及系统的数据流链路,在数据链路上关键处打点上报日志+指标3 用户可观测黑盒:决定以什么方式告知用户异常(push? 二 可观测前置条件1 服务状态感知 (client视角,结构化日志、模调指标)2 服务状态采集(数据server视角,es,普米)3 展示平台(grafana,es)4 告警=事件告警(无状态)+指标告警 (有状态)三 观测维度1 业务观测流量时延错误饱和度(特定状态)2 资源监控系统自身第三方依赖、中间件3 性能监控(业务定义的关注性能)4 租户状态跟踪(大客户监控面板)5 全景监控大盘

    45530编辑于 2022-07-14
  • 来自专栏charlieroro

    BCC(可观测性)

    BCC(可观测性) 目录 BCC(可观测性) 简介 动机 安装 安装依赖 安装和编译LLVM 安装和编译BCC windows源码查看 BCC的基本使用 工具讲解 execsnoop opensnoop btrfs, xfs, zfs*) biolatency biosnoop cachestat tcpconnect+tcpaccept+tcpretrans runqlat profile BCC的开发 可观测性 Hello World Lesson 2. sys_sync() Lesson 3. hello_fields.py Lesson 4. sync_timing.py Lesson 5. sync_count.py p 185 # trace PID 185 only profile 推荐使用strace和perf trace命令 BCC的开发 本节介绍使用Python接口进行BCC的开发,包括两部分:可观测性和网络 可观测性 Lesson 1. Hello World 执行examples/hello_world.py,并在另一个会话中执行一些命令(如ls),此时会打印"Hello,World!". # .

    3.8K30发布于 2020-07-09
  • 来自专栏Elastic Stack专栏

    Elastic可观测解决方案8.9:发布可观测AI助手

    Elastic可观测解决方案团队非常高兴地宣布,在8.9版本中发布Elastic可观测AI助手的初始(技术预览版)版本。 Elastic可观测AI助手将生成式AI融入以下用户工作流程中:针对日志信息的Elastic AI助手:提供使用生成式AI查找日志消息详细信息的含义并帮助您查找相关消息的能力视频内容针对APM错误的Elastic

    1.6K51编辑于 2023-07-29
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    Google Earth Engine ——全球JRCGSW1_3MonthlyHistory数据集的观测数据

    这些数据是使用1984年3月16日至2020年12月31日期间获取的Landsat 5、7和8的4453,989个场景生成的。 该合集包含442张图片,1984年3月至2020年12月期间每个月一张。 03-16T00:00:00 - 2021-01-01T00:00:00 数据集提供者 EC JRC / Google 采集片段复制 ee.ImageCollection("JRC/GSW1_3/ 这些数据是使用1984年3月16日至2020年12月31日期间获取的Landsat 5、7和8的4453,989个场景生成的。 该合集包含442张图片,1984年3月至2020年12月期间每个月一张。

    44310编辑于 2024-02-02
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    Google Earth Engine ——全球JRCGSW1_3YearlyHistory数据集的观测数据

    这些数据是使用1984年3月16日至2020年12月31日期间获取的Landsat 5、7 Dataset Availability 1984-03-16T00:00:00 - 2021-01-01T00 :00:00 Dataset Provider EC JRC / Google Collection Snippet Copied ee.ImageCollection("JRC/GSW1_3/YearlyHistory Value Color Color Value Description 0 #cccccc No data 1 #ffffff Not water 2 #99d9ea Seasonal water 3 (doi:10.1038/nature20584) 代码: var dataset = ee.ImageCollection('JRC/GSW1_3/YearlyHistory'); var visualization

    36510编辑于 2024-02-02
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    Google Earth Engine ——全球JRCGSW1_3Metadata数据集的观测数据

    这些数据是使用1984年3月16日至2020年12月31日期间获取的Landsat 5、7和8的4453,989个场景生成的。 该产品包含计算全球地表水数据集的观测数据的元数据。从未检测到水的区域被掩盖了。 :00:00 - 2021-01-01T00:00:00 Dataset Provider EC JRC / Google Collection Snippet ee.Image("JRC/GSW1_3/ (doi:10.1038/nature20584) 代码: var dataset = ee.Image('JRC/GSW1_3/Metadata'); var visualization = {

    30310编辑于 2024-02-02
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    Google Earth Engine ——全球JRCGSW1_3GlobalSurfaceWater数据集的观测数据

    这些数据是使用1984年3月16日至2020年12月31日期间获取的Landsat 5、7和8的4453,989个场景生成的。 :00:00 - 2021-01-01T00:00:00 Dataset Provider EC JRC / Google Collection Snippet ee.Image("JRC/GSW1_3/ Value Color Color Value Description 0 #ffffff No change 1 #0000ff Permanent 2 #22b14c New permanent 3 #ff7f27 Seasonal to permanent 8 #ffc90e Permanent to seasonal 9 #7f7f7f Ephemeral permanent 10 #c3c3c3 (doi:10.1038/nature20584) 代码: var dataset = ee.Image('JRC/GSW1_3/GlobalSurfaceWater'); var visualization

    42710编辑于 2024-02-02
  • 来自专栏一个有趣的灵魂W

    好文:来自OCO-3的以城市为中心的卫星CO2观测:洛杉矶特大城市的初步观测

    简而言之一句话:NASA的轨道碳观测3是个好东西! 文中也附有该数据下载地址~欢迎下载自行查阅 ? Los Angeles megacity 来自轨道碳观测3的以城市为中心的卫星CO2观测:洛杉矶特大城市的初步观察 From:加州理工学院 摘要:NASA的轨道碳观测3(OCO-3)旨在支持对人为二氧化碳排放量的量化和监测 首次,我们展示并分析了从OCO-3 SAM和目标模式观测值得出的洛杉矶大城市(LA)上的XCO2分布。 OCO-3的密集观测揭示了城市中XCO2的城市内部变化,这是以前从未从太空中观察到的。 与OCO-2相似,OCO-3的目标模式观测值提供了用于验证XCO2产品的主要数据集,通常是在使用地面TCCON仪器的地点采集的。

    1.6K30发布于 2021-04-29
  • 来自专栏可观测系列

    观测系列——大模型在 IT 运维可观测性的应用

    直达原文:【可观测系列】大模型技术在可观测领域的应用01.前言随着云计算、分布式、微服务等前沿技术的广泛应用,现代IT系统架构已经从传统的单体结构演进到分布式和云原生架构。 02.大模型在可观测领域的应用借助嘉为蓝鲸底座LLMOps开发平台,企业能够快速对接异构大模型,并利用其提供的智能体开发框架,结合私域知识和观测流数据,实现智能化运维场景的快速扩展。 3)事后:总结与优化故障复盘:回顾整个故障处理过程,识别成功之处和需要改进的地方。经验总结:汇总每次故障处理的经验教训,形成有价值的参考资料。 03.场景说明小鲸观测助手,是基于嘉为蓝鲸LLMOps平台,结合嘉为蓝鲸全栈智能观测中心,自主研发的一款基于大模型的观测平台辅助分析工具。 3)系统数据自动查询传统运维工程师面对系统异常时,还在反复切换监控平台、日志平台和SQL查询工具进行查询和分析,而大模型技术正在重新定义数据交互方式,基于Function Call无缝连接系统数据,通过小鲸观测助手

    93610编辑于 2025-04-09
领券