首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深度学习与python

    作业帮服务观测之基础观测能力

    在 2010 年代,云计算引入了发布 - 订阅(pub-sub)、微服务、事件驱动工作流和无服务器模型等模式,现在大多数基于云的分布式系统都是以它们为基础的。 Sentiment: RESPONSE: (GPT 4o-mini) Positive 现如今比较先进的模型是否需要少量的样本才能正确地完成任务? Amazon Bedrock(和许多其他)服务原生支持此功能,而且根据报告,对于大型提示,这减少了高达 85% 的延迟。 然后,你可以通过推理服务器和 LLM 处理这些批次。这种方法可以帮助你增加系统的吞吐量,并确保 GPU 以接近最佳的利用率运行。 在入口点引入一个轻量级的初始模型,类似于传统微服务中的反向代理或 API 网关。像反向代理一样,这个模型可以帮助实现模型之间的负载均衡,缓存频繁使用的响应,并优雅地处理回退。

    21610编辑于 2025-06-08
  • 来自专栏云原生应用工坊

    观测平台-4: 告警配置参考

    概述 此解决方案利用开源工具如ClickHouse、Neo4j、VectorDB、PromQL、LogQL、OpenTracing、Prometheus、Grafana、AlertManager和DeepFlow 这个开源的可观察性平台解决方案通过GitHub Actions自动交付,以创建服务。 根据使用的具体应用程序服务,选择相应的数据源类型进行集成。 查看指标 Grafana Explore与Prometheus数据源集成,允许用户快速识别和解决问题。 record: node_disk_usage expr: 100 - (avg by (instance) (node_filesystem_avail_bytes{fstype="ext4" } / node_filesystem_size_bytes{fstype="ext4"}) * 100) 配置说明: 此示例定义了一个名为“host-monitoring”的规则组,其中包含四个用于计算主机负载

    1.3K10编辑于 2023-12-14
  • 来自专栏程序猿的大杂烩

    Service Mesh - Istio服务观测

    洞察你的服务:使用Kiali观测你的微服务应用 微服务架构可视化的重要性: 痛点: 服务间依赖关系错综复杂 问题排查困难,扯皮甩锅时有发生 可视化的优势: 梳理服务的交互关系 了解应用的行为与状态 什么是 Kiali: Kiali属于Istio的集成组件之一,是一个用于Istio的可观测性控制台,具有服务网格配置和验证功能。 它通过监控网络流量来推断服务拓扑和报告错误,帮助你了解服务网格的结构和运行状况。Kiali提供了详细的度量和基本的Grafana集成,可用于高级查询。 官方定义: Istio 的可观察性控制台 通过服务拓扑帮助你理解服务网格的结构 提供网格的健康状态视图 具有服务网格配置功能 名字含义:源自希腊语,意为望远镜 依赖 Istio 作为宿主,为 Istio 开发有较强的绑定关系 Kiali 是 Istio 服务观测的一环 Kiali 的功能: ?

    1.4K20发布于 2020-12-28
  • 来自专栏运维开发故事

    Kubernetes 可观测性:利用 4 个开源工具

    使用警报规则,用户可以使用 Prometheus 表达式语言定义警报条件,然后将通知发送到外部服务。 使用 Jaeger,执行根本原因分析和研究服务依赖关系要容易得多。例如,Jaeger 可用于识别特定微服务的延迟峰值,包括影响最终用户体验的那些。 微服务架构有很多好处,但是当它们被大规模部署时,工程团队可能会更难以查看服务的执行情况以及它们如何影响其他服务。 首先,借助 Thanos,工程师可以通过允许跨多个服务和集群进行查询来扩展他们的 Prometheus 设置。 原文链接:https://www.cncf.io/blog/2022/08/01/kubernetes-monitoring-leveraging-4-open-source-toolsets/

    1.2K30编辑于 2022-09-15
  • 来自专栏痴者工良

    Isito 入门(四):微服务观测

    本教程已加入 Istio 系列:https://istio.whuanle.cn 可观测性 Istio 集成了 Jaeger、Zipkin 和 Skywalking 等链路追踪应用,能够有效地捕获服务网格的结构 Kiali 使用这些 Prometheus 数据来生成服务之间的流量、错误率、延迟等指标。 Istio 遥测数据:Istio 服务网格生成的遥测数据包括请求、响应、延迟以及 Envoy 代理的其他性能指标。 Kiali 从这些遥测数据中获取服务拓扑信息,以创建服务之间的依赖关系图。 Kiali 将这两个数据源的信息整合在一起,生成 Graph,它展示了服务网格的拓扑结构、服务之间的流量以及其他性能指标。 这有助于用户更好地理解服务之间的依赖关系,发现潜在的性能问题,并优化服务网格配置。 可能失败的原因 如果你的 Kiali 一直显示 Empty Graph。

    79340编辑于 2023-07-24
  • 来自专栏云云众生s

    观测性之旅的4个演进阶段

    已知/未知矩阵对于理解你的可观测性方案的实施情况非常有帮助。 译自 The 4 Evolutions of Your Observability Journey,作者 Hazel Weakly。 在进行可观测性之旅时,每个公司都会经历几个具体的阶段。 我们的身份验证服务完全中断,但仅限于一个地理区域。这是什么意思? 尽管这是第一个阶段,但这实际上是最难的阶段之一。 如果说第一阶段是大多数可观测性工具所在的地方,那么这就是服务水平目标 (SLO) 的时代;这也是可观测性开始以“是,而且”的方式表述的阶段。可观测性? 错误预算开始发挥作用,数据驱动的“足够好”目标得以实现,SLO 和服务水平协议 (SLA) 之间的联系从“感觉驱动”转变为“预测驱动”。 以下是一些有趣的例子: 哪些代码库是最大的业务连续性风险?

    29410编辑于 2024-10-13
  • 来自专栏技术、架构与思维

    .Net微服务实战之可观测

    系列文章 .Net微服务实战之技术选型篇 .Net微服务实战之技术架构分层篇 .Net微服务实战之DevOps篇 .Net微服务实战之负载均衡(上) .Net微服务实战之CI/CD .Net微服务实战之 Kubernetes的搭建与使用 .Net微服务实战之负载均衡(下) .Net微服务实战之必须得面对的分布式问题 前言 很多次去面试,有经验的面试官都会问一个问题,你是怎么去定位日常遇到的问题? 日志、指标、跟踪三者结合起来有一种统称——可观测性 运维是架构的地基,我第一次看到这句是在张辉清写的《小团队构建大网站:中小研发团队架构实践》,说实话,我非常的认同。 可观测性 可观测性的意思是可以由系统的外部输出推断其内部状态的程度,在软件系统中,可观察性是指能够收集有关程序执行、模块内部状态以及组件之间通信的数据。 同时他还支持多种告警接收方式,常见的如邮件、企业信、钉钉等。

    79410发布于 2021-10-09
  • 来自专栏干货满满

    极速体验|使用 Erda 微服务观测接入 Jaeger Trace

    Jaeger 于 17 年 4 月份开源,9 月进入 CNCF 孵化,2019 年 10 月正式从 CNCF 毕业,一跃成为 CNCF 顶级项目。 但在要实现微服务系统完整的可观测性,我们发现 Jaeger 本身也具有一定的局限性: 相比其他的可观测性系统,Jaeger 更专注于链路追踪(Tracing),日志和指标功能支持比较有限。 那么这种情况下我们怎么去降低可观测性平台的复杂性?怎么去提供高可用和高性能的后端服务? 最好的方式是寻找一个能够兼容 Jaeger 的后端系统,提供高可靠、高性能的能力。 当 Jaeger 相遇 Erda Erda 作为一款云上应用协同开发平台,提供了 SaaS 化可开箱即用的可观测性云服务,免去了自己运维多个监控、日志系统后端的复杂性,同时也提供了完整的微服务观测能力, 接下来,我们看一下如何使用 Jaeger SDK 把数据接入 Erda 微服务观测平台。

    95630编辑于 2022-03-09
  • 来自专栏大数据-BigData

    博增值团队可观测性实践落地与回顾-上篇

    前言 前言、理论,实践请参考 博增值团队可观测性探索与实践-初探 、博增值团队可观测性探索与实践-实践 强烈建议优先阅读。 提前说明一下,本人现在已经从博离职了,这篇文章算是对我过去两年多关于可观测性相关工作的反思与回顾吧。 截止23年3月末,博增值团队从上线一站式可观测平台到现在也运行了差不多两年的时间了。 在这两年里,团队成员通过一站式可观测平台不断优化和改进服务,提高了整体系统的性能与稳定性(3个9到4个9,tp99 case by case优化,平均下降 100ms),同时降低了问题发现和定位的时间( 异步处理:对于耗时较长的任务,拆分异步处理,减轻服务器压力,提高响应速度。 4. 传统物理机迁移 k8s: 1. 更多实现细节请参考: 博增值团队可观测性探索与实践-初探 、博增值团队可观测性探索与实践-实践 实施过程 实施过程是项目成功的保证之一。

    69810编辑于 2023-04-18
  • 来自专栏云云众生s

    趋势报告:合并可观测性和IT服务管理

    在 IT 领域,可观测性和 IT 服务管理 (ITSM) 历来在孤岛中运行。但随着 IT 环境变得越来越复杂和繁重,IT 团队需要的不只是点解决方案。 因此,可观测性和 ITSM 服务正在向融合靠拢。这种转变将为 IT 运营 (ITOps) 领域带来巨大的好处,使 IT 团队能够达到前所未有的效率和生产力水平。 什么是可观测性? 随着现代 IT 基础设施变得越来越复杂,该行业已投入时间、金钱和精力来改进可观测性工具和服务。 但可观测性的承诺并不是 IT 复杂性的万能药。 在提供有效的服务感知和可用性方面,可观测性只是难题的一部分。 看看这些数字:根据 Enterprise Strategy Group 研究,91% 的组织在部署可观测性解决方案时报告遇到了挑战。 可观测性的目标是提供对 IT 生态系统的可见性和理解。可观测服务和 ITOps 团队需要采取的警报之间经常存在差距。

    18810编辑于 2024-05-16
  • 来自专栏腾讯云中间件的专栏

    基于 SkyWalking 的腾讯云微服务观测最佳实践

    本文主要基于智慧零售腾讯有数产品的业务背景分享基于 SkyWalking 的腾讯云微服务观测实践,希望给有这方面需求的同学一些启发。 skywalking-trace 腾讯微服务观测平台:TSW 确定了组件之后,如何能让开发同学更专注于业务功能开发,而不需要关注 SkyWalking 底层服务的日常运维? agent.service_name=XXX-api step4: 重启服务待有流量进来之后可验证界面是否有对应的拓扑图(也可通过查看 logs/xxx 查看是否上报异常) ? 腾讯微服务观测平台产品概述: https://cloud.tencent.com/document/product/1311/50754 3. Agent 探针性能揭秘: https://github.com/SkyAPMTest/Agent-Benchmarks/blob/master/README_zh.md 4.

    1.9K40发布于 2021-03-29
  • 来自专栏架构驿站

    分布式应用的 4 个核心可观测性指标

    作者 | Michael Bogan 译者 | Luga Lee 策划 | Luga Lee 基于关键的可观测性指标,我们更能了解我们的应用服务运行状态,以便提升服务运行效能。 设置适当的监控将为我们提供更完整的观测图,但可能很难知道从哪里开始。在这篇文章中,我们将介绍可观测性指标应该关注的那些服务领域,以确保大家不会错过关键信息。 我们的服务器作为 HTTP 响应发出的任何 5xx(甚至 4xx)都应该被标记和计数。即使我们已经考虑到的情况,例如捕获的异常,也应该受到监视,因为它们仍然代表非理想状态。 简而言之,捕获产生错误时的服务状态可以帮助我们在开发和测试环境中复制问题。 4、饱和度 除此之外,我们还应该跟踪每个微服务的内存使用情况、CPU 使用情况、磁盘读/写和可用存储。 如果我们服务的资源使用在某些时间或操作期间经常激增或以稳定的速度增加,则表明应用服务过度使用了服务器资源。虽然服务器可能按预期运行,但再次涌入的流量或其他不可预见的事件可能会迅速推翻它。

    1.8K30编辑于 2021-12-10
  • 来自专栏微信小开发

    4.信支付

    步骤一 通过认证后,在小程序后台左侧菜单栏找到“信支付”,点击“开通”。 步骤二 点击新申请。申请过程不可逆,不能返回重填,所以填写资料的时候要谨慎。 步骤三 填写基本信息。 审核过程中,腾讯会做两件事: 给你的邮箱发送一封邮件,里面含有商户号和密码,是登陆信支付商户平台的账号和密码。 向你的银行卡打一笔小额钱款,你需要去查到这个款项的金额。 步骤十 百度“信支付商户平台”,点击官网,用商户平台登录账号和密码登录。 步骤十一 点击“账户验证”,输入银行卡收到的金额,完成验证。 步骤十二 签署协议,完成信支付申请。 查看小程序管理教程,请点击乐墨花时光商城公众号菜单的商家服务——小程序使用教程。

    1.9K60发布于 2018-01-23
  • 来自专栏新技术

    ​可观测性之Log4j2优雅日志打印

    相关的依赖包是log4j和适配log4j2的桥接包log4j-1.2-api。 相关的依赖是slf4j-api和适配log4j2的桥接包og4j-slf4j-impl或者log4j-slf4j2-impl。 目前,存在用于控制台、文件、远程套接字服务器等日志的追加Layout(布局): 通常情况下,用户不仅希望自定义输出目标,还希望自定义输出格式。 在日志打印格式中设置获取链路追踪id的获取方式%X{TraceId} ,然后在Java代码中将链路追踪Id放入日志诊断上下文MDC中即可如代码: MDC.put("TraceId", "123456");总结日志也是我们最常用的观测系统健康状况的方式 如果还有其他问题可以关注信公众号 《中间件源码》 一起交流吧。

    2.1K30编辑于 2023-01-06
  • 来自专栏菩提树下的杨过

    langchain4j 学习系列(9)-AIService与可观测

    除了这些,langchain4j还提供了更高抽象级别的AIService,可以极大简化代码。 一、基本用法 1.1 定义业务接口 1 /** 2 * @author junmingyang 3 */ 4 public interface ChineseTeacher { 5 6 onError(sink::tryEmitError) 18 .start(); 19 return sink.asFlux(); 20 } 四、可观测性 文中代码: https://github.com/yjmyzz/langchain4j-study/tree/day09 参考: https://docs.langchain4j.dev/tutorials /observability https://docs.langchain4j.dev/tutorials/ai-services

    34110编辑于 2026-01-12
  • 来自专栏Java架构师历程

    4服务发现

    在运行于物理硬件上的传统应用中,服务实例的网络位置是相对静态的。例如,您的代码可以从偶尔更新的配置文件中读取网络位置。 然而,在现代基于云的微服务应用中,这是一个更难解决的问题,如图 4-1 所示。 之后,客户端利用负载均衡算法选择一个可用的服务实例并发出请求。 图 4-2 展示了该模式的结构 ? 服务实例的网络位置在服务注册中心启动时被注册。当实例终止时,它将从服务注册中心中移除。 4.3、服务端发现模式 服务发现的另一种方式是服务端发现模式。图 4-3 展示了该模式的结构: ? 客户端通过负载均衡器向服务发出请求。负载均衡器查询服务注册中心并将每个请求路由到可用的服务实例。 4.6、自注册模式 当使用自注册模式时,服务实例负责在服务注册中心注册和注销自己。此外,如果有必要,服务实例将通过发送心跳请求来防止其注册信息过期。 图 4-4 展示了该模式的结构。 ? 图 4-5 展示了该模式的结构: ? 开源的 Registrator 项目是一个很好的服务注册器示例。它可以自动注册和注销作为 Docker 容器部署的服务实例。

    2.6K30发布于 2018-09-26
  • 来自专栏TakinTalks稳定性社区

    七年4个阶段:滴滴可观测架构演进与实践

    1.2 可观测架构演进的4个阶段 1.2.1 阶段一:2017年以前 当业务需求发生变化时,存储模块的性能问题通常是最先暴露出来的。在2017年以前,滴滴主要使用InfluxDB作为存储选择。 但是,这两个方案由于使用了大量的第三方服务,如果公司没有对象存储或者没有云服务,那么这些组件的维护工作可能就需要由可观测团队来完成。 因此,第一个原则就是不能让可观测的系统自观测。第二个原则与第一个原则有关,即需要一套独立的数据采集和报警服务来进行观测。 在我们的实践中,主要采用了两种方法。 综合来看,实现可观测性的方法大概有三种。第一种是购买SaaS厂商的服务,第二种是尽可能地采集和存储详尽的可观测数据,第三种是关联多种观测数据。 4、接口偶发性超时,调用链只能看到超时接口名称,看不到内部方法,无法定位根因,也难以复现,怎么办?

    1.3K10编辑于 2023-12-04
  • 企业信接口在可观测性平台中的深度集成实践

    企业信接口在可观测性平台中的深度集成实践随着现代分布式系统复杂度不断提升,可观测性(Observability)已成为保障系统稳定性的核心技术支柱。 本文将深入探讨如何将企业信接口深度融入可观测性技术栈,构建具备主动洞察与协同排障能力的智能运维体系。一、可观测性场景下企业信的定位演进在传统的可观测性实践中,企业信常被简化为“告警通知通道”。 ├──告警收敛与智能路由├──上下文组装服务├──交互式诊断卡片生成└──协同作战室管理三、核心技术实现方案1.基于OpenTelemetry的端到端可观测性集成通过标准化可观测性数据模型,实现与企业信接口的无缝对接 alertService.sendErrorDiagnosticCard(getOnCallEngineer(span.getServiceName()),card);//重置计数器errorCounts.remove(serviceKey);}}}//企业信可观测性告警服务观测性数据的长期存储与分析构建专门的企业信可观测性数据仓库,支持长期趋势分析。

    10710编辑于 2026-02-07
  • 来自专栏滚雪球学SpringBoot

    服务网格环境下实现微服务的可观测性与诊断能力!

    而在这些功能中,可观测性与诊断能力无疑是最为关键的部分。  在本篇文章中,我将深入探讨如何在服务网格环境下,通过使用 Istio 或 Linkerd 等技术来提升微服务架构的可观测性与诊断能力。 通过服务网格,我们可以在不改变微服务本身的代码情况下,获得全面的可观测性和强大的诊断能力。 真实的应用中,这部分通常会通过 HTTP 客户端(如 HttpClient)发送请求到服务器并获取响应。不过在这个简化版本中,我们直接返回固定的字符串,模拟了服务器响应。4. 通过本文的分析和示例,相信你已经掌握了如何利用服务网格提升微服务架构的可观测性与诊断能力。 如果你也在面对微服务架构中的可观测性和故障排查问题,服务网格绝对值得你去尝试并深入学习。  愿你在微服务的世界中,能够通过强大的可观测性和诊断能力,为你的应用和用户带来更加稳定、可靠的服务

    55821编辑于 2025-02-21
  • 来自专栏痴者工良

    Istio 入门(三):体验 Istio、微服务部署、可观测

    在本章中,我们将会学习到如何部署一套微服务、如何使用 Istio 暴露服务到集群外,并且如何使用可观测性组件监测流量和系统指标。 书店微服务 本章教程示例使用的是 Istio 官方的一套微服务,这套微服务是一个在线书店,打开页面之后会看到一个分类、书的信息以及书的评论,页面的内容由不同的子服务提供。 书店微服务分为四个单独的微服务,在上图中已经使用红色方框画出来了。这四个微服务分别是: productpage: 汇集所有服务的数据,生成浏览页面。 在这个微服务中,Productpage 服务对外提供 Web 访问页面,而且其它的三个服务只能在集群内部访问。 四个服务分别采用了不同的语言开发,Productpage 聚合其它三个服务的信息生成一个页面。 在微服务设计中,我们不要每个子服务都暴露端口到集群外部,应该通过一些应用集中数据后给外部显示。

    2.5K31编辑于 2023-07-24
领券