首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏后端技术

    串行化 数据库恢复 观测序列化

    串行化 冲突串行化是串行化的充分条件 CLR Compensation Log Record 数据库恢复 分析阶段 graph TD A(把事务加入事务表)-->C(把已结束的事务剔除出事务表) 观测序列化 很好的参考文章

    90640发布于 2019-05-25
  • 来自专栏云原生应用工坊

    观测平台-4: 告警配置参考

    概述 此解决方案利用开源工具如ClickHouse、Neo4j、VectorDB、PromQL、LogQL、OpenTracing、Prometheus、Grafana、AlertManager和DeepFlow record: node_disk_usage expr: 100 - (avg by (instance) (node_filesystem_avail_bytes{fstype="ext4" } / node_filesystem_size_bytes{fstype="ext4"}) * 100) 配置说明: 此示例定义了一个名为“host-monitoring”的规则组,其中包含四个用于计算主机负载 rules: - alert: HighDiskUsage expr: node_filesystem_avail_bytes{fstype="ext4" grafana/latest/ 2 Prometheus 文档:https://prometheus.io/docs/ 3 deepflow 文档:https://deepflow.io/docs/zh/ 4

    1.3K10编辑于 2023-12-14
  • 来自专栏运维开发故事

    Kubernetes 可观测性:利用 4 个开源工具

    借助 Alertmanager,团队能够使用预配置和自定义的警报来识别发生的重要问题。使用警报规则,用户可以使用 Prometheus 表达式语言定义警报条件,然后将通知发送到外部服务。 原文链接:https://www.cncf.io/blog/2022/08/01/kubernetes-monitoring-leveraging-4-open-source-toolsets/

    1.2K30编辑于 2022-09-15
  • 来自专栏云云众生s

    观测性之旅的4个演进阶段

    已知/未知矩阵对于理解你的可观测性方案的实施情况非常有帮助。 译自 The 4 Evolutions of Your Observability Journey,作者 Hazel Weakly。 在进行可观测性之旅时,每个公司都会经历几个具体的阶段。 简而言之,这三个任务几乎涵盖了我们在平台工程、可观测性、站点可靠性工程 (SRE) 工作、DevOps 等方面所做的一切。 说实话,如果您不能充分阐明为什么可观测性之旅对公司至关重要,那么您将永远无法完成这段旅程。人的理解和共同的动机必须放在首位。 如果说第一阶段是大多数可观测性工具所在的地方,那么这就是服务水平目标 (SLO) 的时代;这也是可观测性开始以“是,而且”的方式表述的阶段。可观测性?

    29410编辑于 2024-10-13
  • 来自专栏EMQ 物联网

    易操作、可观测扩展,EMQX如何简化物联网应用开发

    本文将从可操作性、可观测性、扩展性三个方面,与大家分享 EMQX 5.0 在运维监测、问题排查以及功能扩展中的功能优化,共同探索如何更快的利用这些优化搭建运维监控体系,为物联网业务带来更多助力。 配置热更新根据是否可在运行时修改,EMQX 5.0 的配置可以分成热更新/不可热更新两种配置。 热更新配置都可以通过 HTTP API 修改成功后立即生效,同时保证配置修改在集群间同步更新。 可观测性强大的日志功能日志为系统排错、优化性能提供可靠信息来源。EMQX 在日志数据过载或日志写入过慢时,默认启动过载保护机制,最大限度保证正常业务不被日志影响。 如前文提到,可操作性与可观测性的提升将使 EMQX 集群的运维工作变得更加轻松与高效,扩展性的增强则为用户定制更加符合自身需求的 EMQX 提供了便利。

    1.1K00编辑于 2022-10-10
  • 来自专栏blackheart的专栏

    4-空类型、静态类

    空类型 值类型是不可以为null的[即不可为空值], 假如我们想让它为null呢[比如它对映这数据库中的某个表的某个字段,但是这个字段是null]。 System.Nullable<T>泛型类原型: 1 [Serializable]//表示了序列化 2 public struct Nullable<T> where T : struct 3 { 4

    1.1K50发布于 2018-01-19
  • 来自专栏重归混沌

    谈谈观测

    随着这几年我对 eBPF、Prometheus 等工具的深入了解,我才逐渐意识到“可观测性”这个词背后蕴含的意义。 很早以前,我就在 Linux 上使用 /proc/、top、sar 等工具来排查问题,却从未意识到,“观测”竟然是一门独立的学问。 这也正是“可观测性”弥足珍贵的原因之一:当系统出问题时,我们可以通过系统本身提供的可观测能力,去追踪和理解到底发生了什么。 不得不佩服 Linux 的设计者们,/proc 文件系统的设计在多年以前就已体现出极强的可观测性理念。 我并不想讲怎么样实现可观测性,毕竟我不是专家。 但我想谈谈观测给了我们一个什么样的视角。 这从侧面也说明了,当我们通过观测来排查问题时,并不需要一上来就去了解整个系统的实现细节,从宏观视角就可以排查很多问题。 这一点很重要,前面铺垫了这么多,都是为了这个观点。

    7810编辑于 2026-03-25
  • 来自专栏架构驿站

    分布式应用的 4 个核心可观测性指标

    作者 | Michael Bogan 译者 | Luga Lee 策划 | Luga Lee 基于关键的可观测性指标,我们更能了解我们的应用服务运行状态,以便提升服务运行效能。 设置适当的监控将为我们提供更完整的观测图,但可能很难知道从哪里开始。在这篇文章中,我们将介绍可观测性指标应该关注的那些服务领域,以确保大家不会错过关键信息。 我们的服务器作为 HTTP 响应发出的任何 5xx(甚至 4xx)都应该被标记和计数。即使我们已经考虑到的情况,例如捕获的异常,也应该受到监视,因为它们仍然代表非理想状态。 4、饱和度 除此之外,我们还应该跟踪每个微服务的内存使用情况、CPU 使用情况、磁盘读/写和可用存储。

    1.8K30编辑于 2021-12-10
  • 来自专栏菩提树下的杨过

    langchain4j 学习系列(9)-AIService与可观测

    除了这些,langchain4j还提供了更高抽象级别的AIService,可以极大简化代码。 一、基本用法 1.1 定义业务接口 1 /** 2 * @author junmingyang 3 */ 4 public interface ChineseTeacher { 5 6 onError(sink::tryEmitError) 18 .start(); 19 return sink.asFlux(); 20 } 四、可观测性 文中代码: https://github.com/yjmyzz/langchain4j-study/tree/day09 参考: https://docs.langchain4j.dev/tutorials /observability https://docs.langchain4j.dev/tutorials/ai-services

    33910编辑于 2026-01-12
  • 来自专栏新技术

    ​可观测性之Log4j2优雅日志打印

    架构说明定位Log4j 2 旨在用作审计日志记录,被设计为可靠、快速和扩展,易于理解和使用的框架。简单的来说Log4j2就是一个日志框架,用来管理日志的。 无侵入性: 通过扩展机制自动加载,无需与代码完全耦合,代码中可以使用SLF4J门面插件架构: 插件化配置, 自动识别插件并在配置引用它们,极高的扩展性属性配置支持: 可以在配置中引用属性,Log4j 可以看到Log4j2 核心的机制中考虑到了高性能,扩展,可配置等需求,有效的解决着我们使用日志的痛点,那接下来就来从整体来了解下Log4j2。 --滚动归档文件的日志追加器,这里配置的是Error级别的日志可以打印到error.log文件中 同时根据日期(天)和大小(最大250MB)进行文件归档--> <RollingFile 在日志打印格式中设置获取链路追踪id的获取方式%X{TraceId} ,然后在Java代码中将链路追踪Id放入日志诊断上下文MDC中即可如代码: MDC.put("TraceId", "123456");总结日志也是我们最常用的观测系统健康状况的方式

    2.1K30编辑于 2023-01-06
  • 2026年,MySQL到SelectDB同步为何更关注实时、可观测校验?

    校验”。 可观测很多同步链路更需要关注的,不是任务失败本身,而是失败之前是否能被发现。 校验同步过去,不等于结果就一定可信。 4. 为什么要求在变化因为实时分析已经不再是可选项,而越来越像基础能力。 可观测,决定问题能不能及时被发现。校验,决定结果能不能被业务信任。

    6810编辑于 2026-03-31
  • 来自专栏大数据文摘

    用航拍和地面观测数据,DeepMind AI完成在陌生区域导航

    接下来,他们着手进行一个转移学习任务,该任务通过观测航空视图目标区域获得数据并进行适应性训练,最后使用地面视图观察转移到目标区域。 ?

    60920发布于 2019-07-02
  • 来自专栏初代庄主

    观测 CPU

    背景 通常在分析性能问题时,我们会用 `top , sar , perf` 来观测 CPU 的使用情况;多数据情况下是观测别人的程序。 如果从熟悉工具的角度来看,观测自己的程序,根据观测到的结果再结合程序源代码,对于我们掌握性能分析工具会更有帮助。 for(;;) { // 不断的查询父进程的 pid ,这个会占用 sys 空间 getppid(); } } ---- sar 看 cpu 的使用率 要观测所有 0.00 99.01 平均时间: 3 0.20 0.00 0.40 0.00 0.00 99.40 平均时间: 4

    53040编辑于 2022-05-17
  • 来自专栏深度学习与python

    作业帮服务观测之基础观测能力

    同样重要的是,你可以创建重用的提示,将它们跨模型、任务和领域泛化。 让我们看下以下四种具体的提示模式。 让我们看一个非常简单的例子(通过 OpenAI API 使用“GPT-4o-mini”;你可以使用 OLLAMA 或 Hugging Face Transformers 在本地运行类似的提示): PROMPT Sentiment: RESPONSE: (GPT 4o-mini) Positive 现如今比较先进的模型是否需要少量的样本才能正确地完成任务? 图 4:上下文引导模式示例 可编辑输出模式 使用 GenAI 模型,在许多场景中都没有唯一的正确答案。最佳输出取决于上下文、应用程序和用户偏好。认识到这一点,你就应该考虑让用户修改或重写生成的内容。 同样,你必须做出明智的系统优化选择,无论是将流量从不必要的强大模型重定向,缓存预测的响应,实时批处理查询,还是开发更小的专用模型。

    21610编辑于 2025-06-08
  • 来自专栏TakinTalks稳定性社区

    七年4个阶段:滴滴可观测架构演进与实践

    作者介绍 滴滴出行可观测架构负责人——钱威 TakinTalks稳定性社区专家团成员,滴滴出行可观测架构负责人。深耕可观测领域多年,专注于架构设计与优化。 1.2 可观测架构演进的4个阶段 1.2.1 阶段一:2017年以前 当业务需求发生变化时,存储模块的性能问题通常是最先暴露出来的。在2017年以前,滴滴主要使用InfluxDB作为存储选择。 2.1 如何观测观测系统? 我们不能让可观测的系统对其本身做观测。例如,如果存储系统出现故障,而查询数据的方式是从自身的存储中查询,那么就会形成循环依赖。 我们先来看一下各大厂对可观测性的定义。 可观测性是帮助团队有效调试其系统的工具或技术解决方案。可观测性基于对事先未定义的属性和模式的探索。 4、接口偶发性超时,调用链只能看到超时接口名称,看不到内部方法,无法定位根因,也难以复现,怎么办?

    1.3K10编辑于 2023-12-04
  • 2025企业可观测产品选型实战指南:可观测是什么?可观测平台怎么选?

    选择一款适配自身架构的可观测平台,成为企业保障业务连续性、降低运维成本的关键。本文先厘清可观测的核心定义与价值,再通过3款可观测平台的深度对比,结合实战选型逻辑,助力企业精准落地可观测能力。 02.3款可观测平台对比1)嘉为蓝鲸全栈智能可观测中心核心定位面向中大型企业的全栈智能可观测平台,以“指标、日志、调用链、拓扑”全链路数据融合为基础,“业务可观测”为核心,“AI智能闭环”为驱动,覆盖从底层硬件到上层业务的全链路观测 4大核心维度1)按IT架构适配选型混合架构+国产化需求:首选嘉为蓝鲸,全栈兼容传统、云原生、国产软硬件,无需多工具整合;纯腾讯云生态:选腾讯云TCOP,云资源联动效率高,部署成本低;网络专项需求:选SolarWindsNPM 中小企业优先解决核心痛点:若为腾讯云用户,可选腾讯云TCOP(SaaS模式,按用量付费);若需基础全栈观测,可先用开源工具搭建基础能力,再逐步升级至嘉为蓝鲸等企业级平台。 A:嘉为蓝鲸的核心优势集中在“复杂架构适配+业务深度关联+国产化合规”:混合架构场景:同时兼容国产软硬件与多云环境,腾讯云TCOP聚焦腾讯云生态;业务可观测场景:嘉为蓝鲸可直接关联业务交易与IT故障,

    25910编辑于 2025-11-19
  • 来自专栏我的小碗汤

    2022 年 Kubernetes 的 4替代方案

    Docker:这几乎不是第一个容器平台[3],但却是第一个流行起来的平台,它使基于容器的计算成为主流,于 2014[4]年开始开发一种编排工具 Swarm 。 几乎不是第一个容器平台: https://www.itprotoday.com/containers/history-container-technology-offers-lessons-future [4] suse-completes-rancher-acquisition/ [8] 创建了一个编排平台: https://github.com/spotify/helios [9] 原因: https://www.itprotoday.com/hybrid-cloud/4-

    3.1K40编辑于 2023-03-19
  • 来自专栏云云众生s

    4个令人意外的不可靠可观测性的成本

    有效的可观测性可以减少业务中断、故障排除时间和工程疲劳,同时提高客户满意度。 译自 4 Unexpected Costs of Unreliable Observability。 不可靠的可观测性正在(并将继续)给您带来4大成本 业务和收入中断 即使您的应用程序还在运行,当您的可观测性平台关闭时,您也无法完全经营您的业务。例如,当可观测性停止时,审计跟踪可能中断。 这意味着在可观测性平台恢复之前,您无法允许任何交易。当可观测性平台不可用时,您还可能需要告诉您的工程师停止部署。在这两种情况下,不可靠的可观测性工具都会耗费您的时间和金钱。 不可靠的可观测性降低了对可观测性工具的信心。开发人员在推出新代码时会犹豫 - 这会减慢部署和业务。 工程师疲劳 可观测性停机时间的人为成本是真实的,导致疲劳,从而对您的收入和利润产生负面影响。 如何提高可观测性投资回报率(ROI) 最近的一份Forrester Research报告显示,可靠的可观测性解决方案每年可以减少75%的严重事件。

    21110编辑于 2024-03-28
  • 蓝鲸观测平台:统一观测数据关联模型探索

    前 言本文为蓝鲸观测平台数据模块负责人 在 蓝鲸智云 和 DeepFlow 社区 合办的第六场 eBPF 零侵扰可观测性 Meetup 上的演讲,原来题为根因定位关键:统一观测数据关联模型探索概 述根因分析高度依赖关联的观测数据 这里我专门标出一个黄色的点 IPv4、IPv6,其实现在我们经常做的一件事,就是 IPv6 改造。 第三个是扩展性,也是我刚刚一直在提到的一个点,拿 IPv6 来举例,就是一个主机之前是 IPv4,要扩展它 IPv6,这是一个很大的工作量。 下面也可以看一下主机,这个主机之前定义了一个叫 System,它的 IP 可能就是一个 IPv4 的 IP,这时候突然之间有了 IPv6 的诉求,那么就新增一个 IPv6 的实体,再通过这个 IPv4 整个体系的各个组件均具备插拔性,整体以蓝鲸企业版的形式开源对外。

    89410编辑于 2024-09-27
  • 来自专栏存储内核技术交流

    从磁盘存储维度观测ext4文件系统

    // 创建空文件 $ touch /mnt/ext4/a.txt // Blocks是磁盘扇区的大小,IO Block是操作系统每次IO的大小(4K),明显占用扇区的大小为0 $ stat /mnt/ext4 a.txt // 这里看到ext4文件系统分配了8个扇区,每个扇区大小是512个字节,所以8个扇区大小就是IO Block大小 $ stat /mnt/ext4/a.txt File: /mnt $ filefrag -v /mnt/ext4/a.txt Filesystem type is: ef53 File size of /mnt/ext4/a.txt is 5 (1 block of $ stat /mnt/ext4/a.txt File: /mnt/ext4/a.txt Size: 5 Blocks: 8 IO Block: a.txt $ touch /mnt/ext4/b.ext $ stat /mnt/ext4/b.ext File: /mnt/ext4/b.ext Size: 0

    1.5K20编辑于 2023-02-26
领券