首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Elastic Stack专栏

    AIOps入门之路:Elastic Stack与AIOps

    什么是AIOps AIOps是Artificial Intelligence for IT Operations的简称,我们可以将之称之为智能化运维。 这里,我将摘抄一些来自于Gartner的具体内容(Market Guide for AIOps Platforms),帮助我们更好的理解AIOps的现状与未来。 以上,是Gartner对于AIOps的精简描述。 领域无关的 AIOps 与以领域为中心的 AIOps 与领域无关的 AIOps —— 供应商使用通用 AIOps 平台进入市场。这些产品往往主要依靠监控工具来执行数据捕获并满足最广泛的用例。 尽管AIOps尚未成熟,但只要有正确的使用案例,AIOps就会被认为是企业内部的一个有价值的工具,并能长期保持嵌入状态(见下图)。

    3.8K82编辑于 2022-03-07
  • 来自专栏01ZOO

    AIOPS 是什么

    为了解决这些问题,一种新的技术被开发出来,它就是AIOPS(人工智能运维),本文将介绍AIOPS的概念、应用和未来趋势。 二、AIOPS的应用1.自动化运维AIOPS可以实现自动化的应用程序部署、监控、故障排除和性能优化等操作。 三、机器学习算法在 AIOPS 中的具体应用例子在AIOPS中,有许多机器学习算法被广泛应用于各种场景中。下面列举几个机器学习算法在AIOPS中的应用例子:1. AIOPS可以自动监控和管理IT系统,及时发现和解决问题,减少系统故障和停机时间,从而降低了维护和修复的成本。五、AIOPS的未来趋势AIOPS作为一种新兴的技术,将在未来继续得到广泛的应用和发展。 六、AIOPS的应用场景AIOPS的应用场景非常广泛,主要包括以下几个方面:1.系统性能监控和管理AIOPS可以监控和管理企业的IT系统,包括服务器、存储、网络、数据库等。

    2.2K91编辑于 2023-02-26
  • 来自专栏Jenkins

    AIOps:DevOps 的未来

    幸好,AIOps 正在成为一种解决方案。 AIOps 一词是由 Gartner 创造的, 他将其解释为: ---- AIOps 结合了大数据,机器学习和可视化技术,通过更强的洞察力来优化 IT 运维。 他的定义以循环中的人为中心,以他的描述 AIOps 基本上是一种高级的大数据分析。 要解决 DevOps 困境,我们要定一个更高的目标。 那么,AIOps 应该是什么? 这是一些 AIOps 的关键要求: AIOps 系统从你的数据中学习并适应应用程序的工作模式 这意味着它不会每次都做同样的事情 AIOps 系统无需人工干预即可制定和实施决策 你可以让人参与循环,直到你完全信任这个系统 AIOps 系统能持续运行 它能成为你的交付中的标准单元 向 AIOps 的过渡正处于起步阶段,但它的热度正在上升,而且已经有了成功案例。

    1.2K20发布于 2019-04-19
  • 来自专栏织云平台团队的专栏

    AIOps线下沙龙回顾

    得益于此,AIOps应运而生,也就是基于算法的IT运维(Algorithmic IT Operations),帮助大量运用人脑决策和手工操作的运维向着智能运维的方向前进,并且持续为企业带来更加先进的业务能力 此次沙龙旨在分享 AIOps 理念与实践经验,促进 AIOps 爱好者们相互交流和学习。希望让对 AIOps 感兴趣的人们有机会相互交流和共同成长。 本次沙龙是 AIOps 风向标 | GOPS全球运维大会2018 · 深圳站 的前哨站。如需了解4月13-14日的GOPS2018深圳站,请点击文末阅读原文。 沙龙分享 3月10日,由高效运维和腾讯织云联合举办的AIOps沙龙在腾讯大厦圆满举行。 现场互动 现场同学求知若渴,在和分享老师的互动环节表现积极,纷纷表达出自己对AIOps的疑问和看法。 ? ? ? 现场进行了三轮抽奖,奖品为4月GOPS全球运维大会门票。气氛一度到达最高点。 ?

    1.4K100发布于 2018-03-28
  • 来自专栏后场技术

    AIOps实现思路思考

    现有环境中,眼和手都有比较成熟的解决方案,但眼和手之间存在鸿沟,无法自动联动,AIOps 正好可以充当桥梁,解决此问题。我们将 AIOps 称之为脑,接受眼的输入,做推理决策,让手去自动化执行。 AIOps 的实现思路大体可以分为四步:接入运维数据、建立知识图谱、编排智能算法、自动化执行。 ? 1 接入运维数据。 做好 AIOps 的前提,是做好基础架构治理和数据治理,使得接入的数据是完全的,同时要不断地进行算法模型优化,使得算法模型是充分优化的,从而使得信息趋于 100%,确定性趋于 100%。 不必 100%确定性,只要超过人的决策能力,就可以用 AIOps 进行自主决策。 ?

    1.4K30发布于 2020-09-03
  • 来自专栏织云平台团队的专栏

    国内外首个 AIOps 企业峰会(附AIOps白皮书)

    AIOps 企业峰会(AIOps Enterprise Summit,缩写:AIES)是国内首个的 AIOps 技术峰会,由数据中心联盟(DCA)和开放运维联盟(OOPSA)联合指导、高效运维社区主办。 AIES 大会是国内外首个 AIOps 标准的官方指定发布平台,共邀国内顶级专家畅谈 AIOps 体系与方法、过程与实践、工具与技术,为您呈现国内外顶级企业的 AIOps 实践经验与工具技术。 ? 企业级 AIOps 实施建议白皮书权威解读 高效运维社区创始人,AIOps 白皮书 发起人 萧田国先生为您权威解读国内首个《企业级 AIOps 实施建议》白皮书。 | 本白皮书由 OSCAR联盟 和 高效运维社区联合牵头并联合国内互联网、金融、电信行业顶级 AIOps 大咖共同编写而成。 ? ? 企业级 AIOps 实施建议白皮书下载 ? 腾讯 AIOps 深度培训 国内外首个《企业级 AIOps 实施建议》白皮书编写专家张戎亲自授课,实操培训,绝对有料。 ? 大会日程 ?

    5.2K41发布于 2018-06-11
  • 来自专栏前沿技墅

    ChatOps = AIOps 落地 + DevOps升级?

    AIOps是必然趋势,那DevOps是否就已过时了呢?ChatOps又是什么?通过本文,让我们一起来探讨这其中的关系,看见隐藏在我们工作中的惊喜! 随着人工智能的兴起,以上问题是否可以通过AI+Ops(即AIOps,智能运维)实现呢? AIOps可以说是自动化运维的升级版,所以并非DevOps的取代者,而是DevOps更高级别的落实者。 在这个互联网业务量飞速增长、人工智能兴起的年代,我们完全可以考虑将自动化运维进一步发展为AIOps。 而ChatOps又恰恰是人工智能技术和DevOps协作理念一个很好的结合,也势必为AIOps和DevOps更好地融合普及加添助力!让我们一起来期待未来开发运维新场景带来的惊喜吧!

    1.7K60发布于 2018-06-08
  • 来自专栏杨建荣的学习笔记

    AIops离我们遥远吗?

    DevOps都玩不好还想玩AIOps? 所以我们要推进DevOps的理念,会受到两个方向的阻力,比如运维和开发团队的支持,或者说是上下级同事的支持。 当然说到AIops的标准,似乎行业里对于它的定义有很多不同的声音,在这方面,对于BAT大厂的思想进行提取和借鉴就是一个不错的行径。我们没法照搬,但是可以做一些取舍和定制。 如果按照行业的一个基本标准来说:AIOps 不依赖于人为指定规则,主张由机器学习算法自动地从海量运维数据(包括事件本身以及运维人员的人工处理日志)中不断地学习,不断地提炼并总结规则。 我翻了下今年关于AIops的一些目标,大体有如下的一些阶段和程度吧。 对于AIops的落地,自己也有了一个初步的思路,后期在工作中会更加强化API接口层的独立性,然后不断的封装,满足业务需求之外,还可以提供更加深度的技术支持。 ?

    45610发布于 2018-07-26
  • 来自专栏运维开发故事

    AIOps系列 | Agent 入门实战

    最近在学习《AIOps》相关的知识课程,为了让学习有一定的收获,所以将其进行了总结分享,如果你恰好也需要,很荣幸能帮到你。

    55211编辑于 2025-08-01
  • 来自专栏AI+运维:智能化运维的未来

    别让 AIOps 变成“闭眼修系统”——说说可解释 AIOps 如何防止二次事故

    别让AIOps变成“闭眼修系统”——说说可解释AIOps如何防止二次事故最近我听到一个很典型的吐槽:“我们上了AIOps之后,系统是能自动修,但修完一次,炸两次。”说实话,这事一点都不意外。 现在不少企业玩AIOps都喜欢讲自动闭环:自动发现问题自动定位自动修复自动回归听着爽得很,但缺了一个最核心的东西:可解释性。说白了,AIOps要做的不是“黑盒拍板”,而是“让机器告诉你为啥这么搞”。 真实世界的AIOps是不确定的我们要承认一个前提:运维问题不是“分类问题”,而是“多变量叠加”。 一个反思:AIOps的价值不是省人,是省命有的人把AIOps视为“裁掉运维人力的武器”。我说句不好听的——这种企业最后都会反噬。 AIOps应该做的是:帮助定位帮助解释帮助决策帮助执行而不是“替人拍脑袋”。结语:AIOps不是上帝,它需要透明化我希望未来的AIOps长成这样:像老司机一样解释风险,而不是像赌徒一样压注命运。

    17710编辑于 2025-12-19
  • 来自专栏后场技术

    AIOps根因分析最佳实践

    3 充分利用 AIOps 进行根因分析 部分原因是由于现代环境中根因分析的困难, AIOps ( https://sweetcode.io/aiops-ebook-ad ) 变得如此重要。 通过使用机器学习自动映射和解释复杂的环境和因果关系,AIOps 可以帮助 IT 团队比仅依靠手动分析更快地找到性能或可用性问题的根源。简单地使用 AIOps 工具将大大提高您的根本原因分析能力。 就是说,您可以采取一些步骤来确保充分利用 AIOps 辅助的根本原因分析。它们包括以下内容。 1. 考虑自动响应 AIOps 的另一个关键功能是它使软件工具可以采取自动措施来解决问题。 此处的教训是,您应该寻找 AIOps 工具 ( https://sweetcode.io/aiops-ebook-ad ) ,这些工具 ( https://sweetcode.io/aiops-ebook-ad

    2.1K10发布于 2020-09-03
  • 来自专栏运维开发故事

    AIOps系列 | 大模型入门实战

    最近在学习《AIOps》相关的知识课程,为了让学习有一定的收获,所以将其进行了总结分享,如果你恰好也需要,很荣幸能帮到你。 文章比较长,可以选择性查看。 AIOps 的实现离不开现在大模型的大力发展,所以要做 AIOps 相关的业务,就需要了解并使用大模型相关知识。本次内容将从以下6个章节介绍大模型相关的知识。 (3)执行代码,获取输出 PS E:\workspace\python\aiops\chat-completions> python . 总结 本文围绕 AIOps 智能运维 与 大语言模型(LLM) 的结合展开,介绍了 Prompt Engineering、Function Calling、RAG、Graph RAG、本地模型部署等关键技术的应用方式

    90110编辑于 2025-07-16
  • 来自专栏罗西的思考

    智能运维AIOps-学习笔记

    0x01 AIOps 背景 1.1 AIOps概述 智能运维的理想状态就是把运维工作的三大部分:监控、管理和故障定位,利用一些机器学习算法的方法把它们有机结合起来。 1.2 AIOps场景 AIOPS场景很多,诸如异常检测、根因分析、故障自愈、容量预测等方面。根据平台的实际场景和业界AIOPS的实践经验,360将AIOPS划分为三个场景:成本、效率和稳定性。 1.3 AIOps能力 AIOps智能运维平台需要提供如下能力: 提供独立、开放的历史/实时数据采集、算法分析平台,整合IT数据和业务指标数据; 提供告警消噪(包括告警抑制、告警收敛等),消除误报或冗余事件 AIOps探索:基于VAE模型的周期性KPI异常检测方法 https://github.com/NetManAIOps/donut 一文讲明白AIOps是什么,有什么用? 看看你们公司能不能用到 AIOPS在360的实践和探索 基于时间序列的异常检测算法小结 亿级用户百TB级数据的 AIOps 技术实践之路(增强版) 百度云说 | 从0到1,AIOps领先业内的实践之路

    3.9K23发布于 2020-09-07
  • 来自专栏大侠之运维

    开源告警管理与AIOps平台

    Python 的模块与包文章链接:https://cloud.tencent.com/developer/article/2472944 本篇文章主要介绍了Python 的模块与包Keep:开源告警管理与AIOps 平台简介Keep 是一个开源的告警管理和 AIOps 平台,提供了一个统一的界面来管理所有告警和事件。 通过以上步骤,你可以快速部署 Keep 平台,开始体验其强大的告警管理和 AIOps 功能。

    2.3K10编辑于 2024-12-03
  • 来自专栏Forrest随想录

    AI时代,我们离AIOps还有多远?

    AI时代,AIOps热炒,这篇算是蹭个热点:)。回到本行,我们运维应该关心的是什么: 1、AIOps到底是什么? 2、AI和Ops究竟是什么关系? 3、AIOps到底会带来哪些改变(颠覆or提升)? 下面以智能监控方面的例子来说明一下,我理解的一整套的AIOps应该是什么样子。 下面一张图完整说明下我对AIOps体系的理解: ? 最后,个人观点和建议: 1、AIOps的发展一定是一个长期演进的过程,AI是Ops的有力补充,进一步降低运维的工作强度和压力,但是AIOps一定建设在高度自动化和完善的运维体系之上的,是一个演进的过程, 不会是一个跳跃性的过程,产生一个完全颠覆性的AIOps模式,将现有的Ops体系替代掉。

    87820发布于 2018-08-09
  • 来自专栏携程技术

    干货 | AIOps在携程的践行

    作者简介 徐新龙,携程技术保障中心应用管理团队高级工程师,负责多个AIOps项目的设计与研发。 随着人工智能时代的到来,携程生产环境运维进入了新的运维时代——AIOps。通过两年多时间的技术投入与实践,AIOps在效率提升、可用性保障、成本优化等运维场景取得了显著的成果。 本文选取了几种典型的运维场景对AIOps在携程的践行展开了介绍,首先让我们从概念认识下AIOps。 从某种意义上讲,AIOps也可以称之为数据运维。 AIOps人员组成上由三大主体构成,即运维工程师、运维开发工程师和运维AI工程师。 ? AIOps目前还属于不断完善和探索阶段,未来会有更多的场景被挖掘和应用。可以预见,面对未来越来越复杂的运维场景和挑战,非AIOps而不能胜任。

    1.6K51发布于 2018-07-05
  • 来自专栏运维开发故事

    AIOps系列 | 基础理论学习

    在正式进入AIOps实践之前,先简单普及下相关的理论知识,我们会从以下几个方面进行介绍: 从精益、敏捷、DevOps到AIOps 什么是AIOps 大模型和AIOps AIOps算法和应用案例 从精益、 AIOps有以下优势: 持续观测监控数据流:AIOps对数据处理的吞吐量和敏感度远远超过人工。 解决运维团队孤岛问题:AIOps能够通过业务指标、日志、追踪数据关联性随时发现问题。 ,加速了AIOps的落地实践。 大模型和 AIOps:大模型发展促进了 AIOps 的落地实践,二者结合诞生新交互方式,利用大模型需打牢五层基石,涉及多种核心技术,不过当前将大模型应用到 AIOps 还面临如大模型幻觉、数据安全等挑战 下面再分享一个常见的 AIOps 实现流程:

    56310编辑于 2025-07-02
  • 来自专栏运维之路

    关于AIOps的一些观点

    AIOps是运维的方向,但AIOps不能单纯的认为一种技术手段或技术平台,而应该是数智时代人机协同的运维模式。 2.数据、算法、场景、知识组成AIOps关键4要素 如Gartner定义中提出,AIOps应用需要利用大数据,现代机器学习技术和其他高级分析技术,是一种相对较高门槛的工作模式。 为了更好地落地AIOps,运维组织需要深刻的理解AIOps的内涵,重点实现思路:以数据为基础、算法为支撑、场景为导向,知识为扩展的AIOps4要素 数据为先,AIOps需要快速生产高质量数据的能力。 3.AIOps的一些其他观点 建立场景地图,体系化、有节奏的落地AIOps。与AI技术在当前大部分领域的应用类似,AI是一种平台能力,而不是业务。 引入AIOps对于故障管理的赋能,一是为了更快,二是为了更准。

    63310编辑于 2022-11-16
  • AI如何赋能IT运维(AIOps

    阶段目标工具/内容1.数据接入与可视化收集日志/监控数据ELK、Prometheus、Grafana2.AI异常检测+告警归并减少告警噪声/定位根因异常检测算法、LSTM预测、GPT日志分析3.自动化修复(AIOps 一句总结:AIOps=经验沉淀+自动分析+主动预测+自动修复,最终目标是无人值守与业务持续可用。

    66810编辑于 2025-11-29
  • 来自专栏运维开发故事

    AIOps系列 | 基础设施即代码

    最近在学习《AIOps》相关的知识课程,为了让学习有一定的收获,所以将其进行了总结分享,如果你恰好也需要,很荣幸能帮到你。 概述 讲 AIOps 的时候为什么要讲 基础设施即代码(Infrastructure as Code,简称IaC) 呢? 在企业中,不论是先进的技术也好,还是优秀的思想也罢,终究都是服务于业务,这些业务都是部署在各种基础设施之上,包括 AIOps 本身的应用,所以可以理解 IaC 是 AIOps 实现自动化的基础平台。 在 AIOps 的加持下,IaC 可以变得更聪明,比如: 自动识别资源的浪费或瓶颈 根据负载预测推荐最优的实例类型 在部署失败的时候提供根因分析和修复建议 那什么是 基础设施即代码(以下简称IaC) 呢 $ terraform init # 预执行 $ terraform plan # 执行部署 $ terraform apply 总结 综上所述,文章系统阐述了基础设施即代码(IaC)的核心概念、与AIOps

    58810编辑于 2025-07-04
领券