首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏后端技术

    串行化 数据库恢复 观测序列化

    串行化 冲突串行化是串行化的充分条件 CLR Compensation Log Record 数据库恢复 分析阶段 graph TD A(把事务加入事务表)-->C(把已结束的事务剔除出事务表) 观测序列化 很好的参考文章

    90640发布于 2019-05-25
  • 来自专栏EMQ 物联网

    易操作、可观测扩展,EMQX如何简化物联网应用开发

    本文将从可操作性、可观测性、扩展性三个方面,与大家分享 EMQX 5.0 在运维监测、问题排查以及功能扩展中的功能优化,共同探索如何更快的利用这些优化搭建运维监控体系,为物联网业务带来更多助力。 配置热更新根据是否可在运行时修改,EMQX 5.0 的配置可以分成热更新/不可热更新两种配置。 热更新配置都可以通过 HTTP API 修改成功后立即生效,同时保证配置修改在集群间同步更新。 可观测性强大的日志功能日志为系统排错、优化性能提供可靠信息来源。EMQX 在日志数据过载或日志写入过慢时,默认启动过载保护机制,最大限度保证正常业务不被日志影响。 如前文提到,可操作性与可观测性的提升将使 EMQX 集群的运维工作变得更加轻松与高效,扩展性的增强则为用户定制更加符合自身需求的 EMQX 提供了便利。

    1.1K00编辑于 2022-10-10
  • 来自专栏重归混沌

    谈谈观测

    随着这几年我对 eBPF、Prometheus 等工具的深入了解,我才逐渐意识到“可观测性”这个词背后蕴含的意义。 很早以前,我就在 Linux 上使用 /proc/、top、sar 等工具来排查问题,却从未意识到,“观测”竟然是一门独立的学问。 这也正是“可观测性”弥足珍贵的原因之一:当系统出问题时,我们可以通过系统本身提供的可观测能力,去追踪和理解到底发生了什么。 不得不佩服 Linux 的设计者们,/proc 文件系统的设计在多年以前就已体现出极强的可观测性理念。 我并不想讲怎么样实现可观测性,毕竟我不是专家。 但我想谈谈观测给了我们一个什么样的视角。 这从侧面也说明了,当我们通过观测来排查问题时,并不需要一上来就去了解整个系统的实现细节,从宏观视角就可以排查很多问题。 这一点很重要,前面铺垫了这么多,都是为了这个观点。

    7710编辑于 2026-03-25
  • 来自专栏大数据文摘

    用航拍和地面观测数据,DeepMind AI完成在陌生区域导航

    接下来,他们着手进行一个转移学习任务,该任务通过观测航空视图目标区域获得数据并进行适应性训练,最后使用地面视图观察转移到目标区域。 ?

    60420发布于 2019-07-02
  • 2026年,MySQL到SelectDB同步为何更关注实时、可观测校验?

    校验”。 可观测很多同步链路更需要关注的,不是任务失败本身,而是失败之前是否能被发现。 校验同步过去,不等于结果就一定可信。 可观测,决定问题能不能及时被发现。校验,决定结果能不能被业务信任。 NineData 产品提供三类交付模式,适配从个人开发到企业核心业务的多类场景需求。

    3010编辑于 2026-03-31
  • 来自专栏初代庄主

    观测 CPU

    背景 通常在分析性能问题时,我们会用 `top , sar , perf` 来观测 CPU 的使用情况;多数据情况下是观测别人的程序。 如果从熟悉工具的角度来看,观测自己的程序,根据观测到的结果再结合程序源代码,对于我们掌握性能分析工具会更有帮助。 for(;;) { // 不断的查询父进程的 pid ,这个会占用 sys 空间 getppid(); } } ---- sar 看 cpu 的使用率 要观测所有

    52740编辑于 2022-05-17
  • 来自专栏深度学习与python

    作业帮服务观测之基础观测能力

    同样重要的是,你可以创建重用的提示,将它们跨模型、任务和领域泛化。 让我们看下以下四种具体的提示模式。 同样,你必须做出明智的系统优化选择,无论是将流量从不必要的强大模型重定向,缓存预测的响应,实时批处理查询,还是开发更小的专用模型。

    21410编辑于 2025-06-08
  • 2025企业可观测产品选型实战指南:可观测是什么?可观测平台怎么选?

    “可观测性”已从技术热词落地为企业IT运维的核心能力,但仍有不少企业混淆“监控”与“可观测”的边界——监控是“被动检测已知问题”,而可观测是“主动探索未知故障”,2025年,企业IT架构愈发复杂,混合云 选择一款适配自身架构的可观测平台,成为企业保障业务连续性、降低运维成本的关键。本文先厘清可观测的核心定义与价值,再通过3款可观测平台的深度对比,结合实战选型逻辑,助力企业精准落地可观测能力。 02.3款可观测平台对比1)嘉为蓝鲸全栈智能可观测中心核心定位面向中大型企业的全栈智能可观测平台,以“指标、日志、调用链、拓扑”全链路数据融合为基础,“业务可观测”为核心,“AI智能闭环”为驱动,覆盖从底层硬件到上层业务的全链路观测 中小企业优先解决核心痛点:若为腾讯云用户,可选腾讯云TCOP(SaaS模式,按用量付费);若需基础全栈观测,可先用开源工具搭建基础能力,再逐步升级至嘉为蓝鲸等企业级平台。 A:嘉为蓝鲸的核心优势集中在“复杂架构适配+业务深度关联+国产化合规”:混合架构场景:同时兼容国产软硬件与多云环境,腾讯云TCOP聚焦腾讯云生态;业务可观测场景:嘉为蓝鲸可直接关联业务交易与IT故障,

    24710编辑于 2025-11-19
  • 蓝鲸观测平台:统一观测数据关联模型探索

    前 言本文为蓝鲸观测平台数据模块负责人 在 蓝鲸智云 和 DeepFlow 社区 合办的第六场 eBPF 零侵扰可观测性 Meetup 上的演讲,原来题为根因定位关键:统一观测数据关联模型探索概 述根因分析高度依赖关联的观测数据 第一部分是在可观测出现之前,我称之为传统监控以及现在经常说的可观测。传统监控和可观测的区别,其实我总结下来可能就是两个不一样的地方,一个是被动,一个是主动。什么叫被动呢? 第三个是扩展性,也是我刚刚一直在提到的一个点,拿 IPv6 来举例,就是一个主机之前是 IPv4,要扩展它 IPv6,这是一个很大的工作量。 整个体系的各个组件均具备插拔性,整体以蓝鲸企业版的形式开源对外。 扩展性:资源模型能够适应未来的变化和扩展需求。时间序列关联资源和其关联关系是随时间变化的。为了准确地进行历史回溯和故障分析,需要将时间序列引入关联模型,构建一个具备时序性的图模型。

    86410编辑于 2024-09-27
  • 来自专栏charlieroro

    Istio可观测

    Istio可观测性 Istio的可观测性包括metrics,日志,分布式链路跟踪以及可视化展示。 目录 Istio可观测性 Prometheus 配置说明 Option 1:合并metrics Option 2:自定义抓取metrics配置 TLS设置 总结 Jaeger 概述 跟踪上下文的传递 使用

    3.2K20发布于 2020-09-07
  • 来自专栏云原生技术呱呱

    观测建设总结

    一 可观测架构1 可观测数据处理架构设计流水日志日志index以及检索(es)监控指标(组件模调+业务指标)告警指标(参考监控指标,分别划分不同场景的阈值+告警级别+处置方法=sla)处理架构选型推荐开源 2 系统可观测白盒:描绘出系统架构,以及系统的数据流链路,在数据链路上关键处打点上报日志+指标3 用户可观测黑盒:决定以什么方式告知用户异常(push? 二 可观测前置条件1 服务状态感知 (client视角,结构化日志、模调指标)2 服务状态采集(数据server视角,es,普米)3 展示平台(grafana,es)4 告警=事件告警(无状态)+指标告警 (有状态)三 观测维度1 业务观测流量时延错误饱和度(特定状态)2 资源监控系统自身第三方依赖、中间件3 性能监控(业务定义的关注性能)4 租户状态跟踪(大客户监控面板)5 全景监控大盘

    43830编辑于 2022-07-14
  • 来自专栏charlieroro

    BCC(可观测性)

    BCC(可观测性) 目录 BCC(可观测性) 简介 动机 安装 安装依赖 安装和编译LLVM 安装和编译BCC windows源码查看 BCC的基本使用 工具讲解 execsnoop opensnoop btrfs, xfs, zfs*) biolatency biosnoop cachestat tcpconnect+tcpaccept+tcpretrans runqlat profile BCC的开发 可观测性 p 185 # trace PID 185 only profile 推荐使用strace和perf trace命令 BCC的开发 本节介绍使用Python接口进行BCC的开发,包括两部分:可观测性和网络 可观测性 Lesson 1. Hello World 执行examples/hello_world.py,并在另一个会话中执行一些命令(如ls),此时会打印"Hello,World!". # .

    3.7K30发布于 2020-07-09
  • 来自专栏Elastic Stack专栏

    Elastic可观测解决方案8.9:发布可观测AI助手

    Elastic可观测解决方案团队非常高兴地宣布,在8.9版本中发布Elastic可观测AI助手的初始(技术预览版)版本。 Elastic可观测AI助手将生成式AI融入以下用户工作流程中:针对日志信息的Elastic AI助手:提供使用生成式AI查找日志消息详细信息的含义并帮助您查找相关消息的能力视频内容针对APM错误的Elastic

    1.6K51编辑于 2023-07-29
  • smartproxyAPI 代理—控制平面 + 策略治理,构建一体化可观测回滚体系

    面向中大型技术团队与企业技术决策者,以”控制平面+策略治理”为核心架构,提供统一接入、统一治理、统一可观测的 API 代理能力。 核心能力概览· 控制平面集中式治理:路由、鉴权、限流、熔断、重试、可观测等策略集中下发,实现统一变更与一键回滚· 企业级稳定性保障:针对 AI 推理、数据采集与高并发场景深度优化,确保请求成功率 >99% IP 资源,覆盖 200+ 国家/地区,支持城市与运营商级别精准定位 [1]· 全协议栈支持:HTTP/1.1、HTTP/2、HTTP/3、Socks5,原生支持长连接与零 RTT 加速· 端到端可观测性 、回滚 [2]。 秉承可靠、透明、创新与客户成功的核心价值,我们致力于提供扩展、高性能的 IP 解决方案,帮助您充分释放数据价值,驱动业务增长 [1][2]。

    33610编辑于 2025-10-24
  • 来自专栏OI

    YbtOJ 755「分治」变量观测

    YbtOJ 755「分治」变量观测 题目链接:YbtOJ #755 小 A 有 n 个变量,分别为 x_{1\sim n}。 接下来依次发生了 q 次事件,分为两种形式: 1 t k q[1] q[2] ... q[k]:假设这是第 p 次 1 操作,则设置一个编号为 p 的观测员,直到 x_{q_1},x_{q_2},\cdots x_{q_k} 与当前相比变化总值大于等于 t 时结束观测。 (保证同一个观测员的 q_{1\sim k} 各不相同) 2 i v:给 x_i 加上 v。你需要输出所有在这次操作结束观测观测员编号。 强制在线。 Solution 考虑将每个人观测时间分为 k 份,每份 \lceil \frac tk \rceil,丢到每个变量对应的 set 里。

    45520编辑于 2022-09-19
  • 来自专栏云云众生s

    涉及业务KPI的可观测性还是非可观测性吗?

    观测性旨在让每一位工程师能够根据对所有系统和应用程序的数据分析,主动地对工作任务进行优先级排序。 当我们想到“可观测性”时,我们大多数人将其定义为“指标、日志和跟踪”。并非如此。 换句话说,可观测性不仅仅是收集和整理数据集。它不仅仅是关于警报、关联和正常运行时间。 可观测性是关于理解各个用户体验的一切。 具体到可观测性的当前形式,主动性并不是基于我们的日志、指标和跟踪的前瞻性指标。 我们的可观测性供应商是否衡量了中断体验和收入损失的下游影响? 不幸的是,现在的答案是:他们没有。 我们知道可观测性需要走向何方。了解我们系统的状态只是第一步。下一步是了解我们用户体验的状态。

    24810编辑于 2024-04-01
  • 来自专栏可观测系列

    观测系列——大模型在 IT 运维可观测性的应用

    直达原文:【可观测系列】大模型技术在可观测领域的应用01.前言随着云计算、分布式、微服务等前沿技术的广泛应用,现代IT系统架构已经从传统的单体结构演进到分布式和云原生架构。 03.场景说明小鲸观测助手,是基于嘉为蓝鲸LLMOps平台,结合嘉为蓝鲸全栈智能观测中心,自主研发的一款基于大模型的观测平台辅助分析工具。 1)脚本插件自动编写大模型解析自然语言指令自动生成适配Prometheus格式的监控脚本、Exporter等插件,嘉为蓝鲸全栈智能观测中心无缝兼容Prometheus 插件生态,通过小鲸观测助手,可在服务器性能 同时批量导入知识库文件,基于用户历史经验提供更丰富的解决方案;告警产生后智能匹配知识库里的解决方案。6)告警划词智能解析运维人员通常通过经验或查找资料来处理告警事件,效率低下且耗时。 基于Embed向量化、logreduce日志聚类、知识图谱拓扑推理等技术,大模型快速解析海量告警间的潜在关联,结合时序预测与异常检测识别异常波动模式。

    82110编辑于 2025-04-09
  • smartproxy API 代理——控制平面 + 策略治理,构建一体化可观测回滚体系

    面向中大型技术团队与企业技术决策者,以”控制平面+策略治理”为核心架构,提供统一接入、统一治理、统一可观测的 API 代理能力。 核心能力概览控制平面集中式治理:路由、鉴权、限流、熔断、重试、可观测等策略集中下发,实现统一变更与一键回滚企业级稳定性保障:针对 AI 推理、数据采集与高并发场景深度优化,确保请求成功率 >99%、系统可用性 + 住宅 IP 资源,覆盖 200+ 国家/地区,支持城市与运营商级别精准定位 [1]全协议栈支持:HTTP/1.1、HTTP/2、HTTP/3、Socks5,原生支持长连接与零 RTT 加速端到端可观测性 基于区域、健康度、权重、延迟与成本的多维度智能调度鉴权与准入控制:全面支持 API Key、用户名/密码、OAuth2、mTLS 等认证方式弹性与容错机制:限流、熔断、重试、超时、自适应退避等策略组合全域可观测能力 、回滚 [2]。

    31510编辑于 2025-10-31
  • 来自专栏Tencent Serverless 官方专栏

    Serverless 可观测性升级,云函数支持应用性能观测 APM

    云函数 + APM,进一步提升 Serverless 可观测性 Serverless 产品免运维、弹性扩缩容的产品特性,意味着由平台来进行请求的调度、资源的分发,也意味着用户在进行问题定位、异常排查时需要依赖平台提供的可观测性功能 对于具有更细粒度、更定制化的可观测性诉求的场景,近日 云函数 SCF 与腾讯云应用性能观测 APM 团队合作,推出了云函数应用性能观测功能,现已正式发布,访问 SCF 控制台启用 APM 配置即可体验。 丰富的指标监控,打造多个函数应用级全局观测 SCF 与 APM 集成,将可观测性的重点从单个系统转为整体系统。 调用链分析能力 调用链分析与依赖拓扑图进行配合,使用调用链分析清晰的展示请求在系统内所有链路的处理情况,还原请求响应过程的完整现场。 在页面上方选择地域,单击需要进行应用性能观测配置的函数名。 3. 在“函数配置”页面,选择右上角的编辑,勾选启用应用性能观测。(首次启用请按照控制台引导完成授权流程) 4.

    1K20编辑于 2021-12-18
  • 来自专栏AIOps

    金融行业可观测案例:业务交易链路可观测建设指南

    直达原文:金融行业可观测案例:业务交易链路可观测建设指南01.引言:金融业可观测建设的迫切性在金融行业,业务系统是企业的生命线(如银行支付、证券交易等场景),任何故障都可能引发重大损失。 可观测性由此成为金融运维的核心能力——它需覆盖从业务交易链路到基础设施的全栈观测,实现从“被动告警”到“主动洞察”的转型。 该技术快速解析海量告警间的潜在关联,突破传统关键词匹配的局限,实现跨系统告警的相似性聚类。这种向量化能力是可观测数据融合的关键基础,使分散的告警事件形成有机整体。 3)建设路径与挑战(1)分阶段实施可观测体系第一年(基础可观测):统一日志规范(如标准化交易日志字段)、补齐APM调用链追踪;第二年(因果可观测):融合指标、日志、追踪数据,构建业务拓扑(KBOM支持日志 02.结语:可观测性驱动金融业务韧性金融行业的可观测建设需以业务连续性为最终目标。

    29010编辑于 2025-06-12
领券