首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • AI接入MCP】

    MCP产品接入AI的案例分析 在云计算和微服务架构盛行的今天,高效成为企业核心需求之一。 MCP(Microservice Control Platform)作为微服务治理平台,结合AI技术实现智能已成为行业趋势。 核心架构设计 MCP的AI模块采用分层设计: 数据层:采集Prometheus指标、ELK日志和Jaeger链路数据 算法层:包含时序预测、异常检测、分类模型等模块 服务层:提供RESTful API 架构支持蓝绿部署模型,确保AI服务高可用。 代码实现示例 1. 某生产环境数据显示,接入AI后年度成本降低28%,系统可用性达到99.99%。

    18910编辑于 2025-12-18
  • 来自专栏AI+运维:智能化运维的未来

    还能“自愈”?聊聊AI加持下的进化

    还能“自愈”?聊聊AI加持下的进化咱们干的都懂,最怕的就是半夜被电话叫醒——“哥,系统挂了!” 而随着AI的结合,这个想法,正一点点变成现实。今天咱们就聊聊:AI结合,怎么搞出一个能自愈的系统?一、为什么需要自愈系统? 传统最大的痛点,就是“人肉救火”:问题发现靠告警:系统挂了,监控发短信,再赶过来。修复速度靠运气:如果是熟悉的问题,几分钟解决;不熟悉的,可能一查就几个小时。 五、我的一点思考很多朋友一听“AI自愈”,就觉得是噱头,好像很玄乎。但我个人的理解是:自愈不是取代,而是帮从重复劳动里解放出来。以前我们要值夜班,守着监控,搞不好一晚上被叫醒好几次。 换句话说,未来的更像是“AI教练”,而不是“救火队员”。六、结语AI结合,本质上是让系统从“被动”变“主动”。以前是出了问题人来修,现在是系统先修,人再优化。

    51410编辑于 2025-08-24
  • 来自专栏AIOps

    DeepSeek X AI 赋能 IT 审批流变为 AI 工作流

    直达原文:【DeepSeek谈AI 驱动的 IT 管理变革:从审批流到AI工作流摘要: 本文深入探讨了人工智能(AI)技术对 IT 管理流程的深远影响与改造。 (3)人员角色的转变随着 AI 技术在运中的广泛应用,人员的角色将发生转变。 (4)AI 在多领域中的应用拓展除了传统的 IT 领域,AI 技术还将在物联网、云计算、大数据等新兴领域的管理中发挥重要作用。 管理者需要积极拥抱这一变革,深入理解 AI流程的影响,合理规划和实施 AI 驱动的改进策略。 通过不断提升工具的能力、优化流程、培养人员的 AI 技能,企业将能够在数字化时代实现管理的智能化转型,提升自身的竞争力和业务连续性,迎接未来更加复杂的 IT 挑战。

    58810编辑于 2025-04-14
  • 来自专栏织云平台团队的专栏

    智能机器人--AI的实践探索【二】

    我们专注于场景,借助于AI技术,开发了智能机器人,为的就是缓解这一矛盾。 登场亮相 什么是智能机器人? 只是开始 在这个AI的东风吹得满世界人心躁动的时代,在这个人人谈AI,处处见AI的时代,我们做智能机器人,确实有着蹭热点的嫌疑。我们也无意去澄清这个嫌疑。 这么多人,这么多企业关注AI,投身AI,连国家也将其作为重大战略,不仅仅出于被AI取代,被时代抛弃的恐惧,更是因为无法拒绝AI给我们带来的无穷想象空间。 当我们出于降低用户使用门槛的需求而引入了自然语言处理技术后,发现原本单纯的客服账号,瞬间充满了可能性。腾讯织云智能机器人,只是AI在运领域的小试牛刀。 当越来越多的AI技术引入领域后,我们能憧憬,我们的征途,正驶向星辰大海吗?

    6.1K61发布于 2018-03-20
  • AI业务综合支撑系统:引爆AI生产力的智能大脑*

    然而,当我们兴高采烈地部署了智能推荐、风控模型、AI客服等应用后,一个巨大的挑战也随之而来:这些AI业务,你真的“管”得好吗?传统的模式,在AI业务面前显得力不从心。 告警风暴来了,团队在海量日志中“捞针”;业务指标下降了,研发团队却要花上数天排查是数据问题、模型问题还是代码问题。这种“救火式”的,不仅效率低下,更严重拖慢了AI业务的创新步伐。 破局的关键,正是“AI业务综合支撑系统”。它不是一个简单的监控工具,而是一个专为AI业务打造的“智能大脑”。它的核心使命,就是将从被动的“响应者”,升级为主动的“驾驭者”。 全景可视:从“管机器”到“管业务”传统关注CPU、内存、网络。而AI业务综合支撑系统,在此基础上,将目光投向了AI的核心要素:数据、算法、模型。 总结而言,AI业务综合支撑系统,是企业在AI时代不可或缺的基础设施。 它用AI的技术,解决了AI业务的难题,将团队从繁琐的日常中解放出来,更专注于业务创新和模型优化。

    24810编辑于 2025-10-24
  • AI如何赋能IT(AIOps)

    一、AI为什么对IT重要? 传统存在几个痛点:传统痛点AI带来的改变告警量大、难筛选根因AI可识别告警关联性并自动根因定位故障靠人工排查,耗时长模型可溯源日志、抓异常趋势并提前预警经验靠个人积累,不可复制AI沉淀规则→ 变成可复用知识库人工巡检、排障重复度高AI可自动巡检、自动修复脚本闭环AI真正落地价值:节省人力成本、缩短故障恢复时间(MTTR)、减少业务中断风险二、AI赋能IT的核心能力AI功能作用可落地场景日志分析 价值:✔避免数据库节点宕机✔保障核心账单业务不出现停机✔形成长期健康评分体系案例3:AI自动化闭环–服务异常自动恢复目标异常发生后不依赖人工处理,形成无人值守自动修复系统。 写在最后AI赋能不是概念,而是已能实打实落地的生产力工具。一句总结:AIOps=经验沉淀+自动分析+主动预测+自动修复,最终目标是无人值守与业务持续可用。

    75710编辑于 2025-11-29
  • 来自专栏AIOps

    AI驱动下监控变革:2025AI技术如何重构IT监控产品效率?

    AI技术成为监控的核心突破口——从“被动告警”到“主动预测”,从“经验依赖”到“数据驱动”,AI正在重构效率。 本文围绕“AI功能”,对比主流监控产品的定位、能力与适用场景,并提供企业选型建议及常见问题解答,助力企业精准选择适配监控工具。01. ,融合LLM大模型与AIOps算法,主打“AI+业务”双驱动,同时满足政企信创合规需求。 ,助手直接给出具体配置步骤,新手也能快速上手。 企业选型常见问题与解答FAQQ1:引入AI功能后,会不会增加团队的学习成本?A:优质的AI功能反而会降低门槛,关键看“AI是否贴合习惯”。

    38610编辑于 2025-10-30
  • 来自专栏AI+运维:智能化运维的未来

    AI赋能:实现任务的智能化自动分配

    引言在现代企业中,团队需要面对复杂的基础设施管理和大量任务的调度问题。从服务器巡检到应用故障修复,工作需要及时、高效且准确地完成。传统的任务分配方式依赖人工,容易导致分配不均、响应迟缓的问题。 而随着人工智能(AI)技术的发展,利用AI实现任务的智能化分配成为可能。本文将详细阐述如何通过AI优化任务分配,并提供具体的代码示例,帮助团队迈向智能化。 案例与效果在一个模拟场景中,通过上述系统,完成了以下优化:任务分配效率提升50%:从传统手工分配的平均5分钟降至2分钟以内。任务完成率提升20%:减少了因任务分配错误导致的延误。 总结AI赋能任务分配不仅提升了效率,还改善了团队协作和用户体验。然而,智能化并不意味着一劳永逸,模型的构建与优化需要结合具体业务场景不断迭代。 希望本文的介绍与示例能为你的团队提供思路,助力实现智能化转型。

    49610编辑于 2025-01-05
  • 来自专栏devops_k8s

    的感悟(做需要考虑事,组织结构,学习地图....)

    需要考虑的事 简介 /* 是在于一个量 最少的人,最多的事 并且保证业务 比如说google的一个数据中心,只有几个人在维护 不能直接的创造价值,而是可以变相的节约成本 简介 的工作方向比较多,随着业务规模的不断发展,越成熟的互联网公司,岗位会划分得越细。 研发 研发负责通用的平台设计和研发工作,如:资产管理、监控系统、平台、数据权限管理系统等。提供各种API供或研发人员使用,封装更高层的自动化维系统。详细的工作职责如下所述。 (1)平台 记录和管理服务及其关联关系,协助人员自动化、流程化地完成日常操作,包括机器管理、重启、改名、初始化、域名管理、流量切换和故障预案实施等。 从月薪5K到50k 简介 这是一个热门问题,也是很多刚进入工作的同学面临的心境。

    7.9K910发布于 2020-12-23
  • 来自专栏AI+运维:智能化运维的未来

    AI辅助的风险预测:智能维新时代

    AI辅助的风险预测:智能维新时代在现代 IT 基础架构中,系统的复杂性不断提升,传统的方式已经难以满足高效、精准的风险预测需求。 AI(人工智能)在运中的应用,尤其是在风险预测领域,正在成为企业降本增效、提升稳定性的关键手段。本文将深入探讨 AI 如何辅助风险预测,并通过代码示例展示其实际应用。1. 预测能力不足:传统主要基于经验判断,而非数据驱动,导致预测不准确。AI 通过机器学习和深度学习技术,能够自动分析数据模式、识别异常,并提前预警风险,大幅提升系统稳定性。2. AI的未来发展AI 在运中的应用远不止于故障预测和异常检测,未来还可能朝以下几个方向发展:自适应调优:通过强化学习实现自动化系统调优,提高资源利用率。 自动化决策:通过 AI 学习

    55200编辑于 2025-01-29
  • 来自专栏AI+运维:智能化运维的未来

    不只是“修电脑”:聊聊如何助力 AI 优化服务质量

    不只是“修电脑”:聊聊如何助力 AI 优化服务质量今天咱聊一个很多人容易忽略的角度——维和人工智能的关系。很多人一听 AI,脑子里蹦出来的都是算法、模型、GPU 卡,感觉离很远。 但真相是:AI 要跑起来、跑得稳、跑得准,全靠这套底层的“地基”。如果没跟上,AI 再聪明也可能“掉链子”。 一、AI 时代的:不仅仅是保姆过去大家对的印象可能是“修电脑的”“重启机器的”“数据库备份的”。但 AI 时代的早就不是这么简单了。 所以不再是“出了问题来修”,而是要 主动优化,未雨绸缪,让 AI 服务质量更高、更稳。二、如何助力 AI 服务质量?我总结了三个方向,既接地气又实用:1. 就像造飞机一样,模型是发动机,但是地勤和塔台。发动机再牛,如果地勤不给力,飞机照样飞不稳。AI的结合,是未来的一个必然趋势。不仅仅是“保姆”,而是 AI 服务的优化师。

    35210编辑于 2025-09-11
  • 来自专栏云云众生s

    AI与人的桥梁:AI作为你的伙伴

    译自 Bridging the AI-Human Divide: AI as Your Operations Teammate 。 人工智能在分析大规模数据、发现模式和提供情境分析方面确实出色;但与人类独特的专业知识合作,将是现代团队最佳的伙伴关系。 同样,在运领域引入人工智能,可以为基于人类专业知识和人工智能分析的决策创造有利环境。 就像国际象棋或航空领域一样,人工智能的引入可以帮助团队做出更好的决策。 通过考量上下文调整数据,人工智能可以确保向团队提供相关和精确的信息流。 自动化分析和理解:人工智能深入分析整合后的数据,发现模式和洞察,而人类指导分析方向,确保与目标一致。 人工智能作为您的团队伙伴 人工智能在准确提供相关信息、提出建议以及分析大规模数据集方面表现突出。对团队来说,人工智能可以成为一位无价的辅助伙伴。

    36910编辑于 2024-03-28
  • 来自专栏kafka专栏

    【kafka】Leader重新选举脚本

    1 指定Topic指定分区用重新PREFERRED:优先副本策略 进行Leader重选举

    3.9K40编辑于 2021-12-31
  • 来自专栏kafka专栏

    【kafka】ConfigCommand脚本

    默认配置 附件 More 日常 、问题排查 怎么能够少了滴滴开源的 滴滴开源LogiKM一站式Kafka监控与管控平台 ConfigCommand Config相关操作; 动态配置可以覆盖默认的静态配置

    3.1K10编辑于 2022-04-13
  • 来自专栏AI+运维:智能化运维的未来

    AI加持:化繁为简的系统瓶颈检测

    AI加持:化繁为简的系统瓶颈检测」在现代领域,系统瓶颈检测是一项绕不开的核心工作。 传统的检测方式,可能需要管理员花费大量时间在日志分析、性能监控工具配置上,甚至要耐心翻阅堆积如山的监控数据。如今,AI技术以迅雷不及掩耳之势席卷IT领域,为工作提供了全新的工具和思路。 AI助力的两大核心优势自动化与高效性:AI算法可以自动分析海量的监控数据,提取关键性能指标,降低了人力成本。 定制化需求高:不同系统的瓶颈特征千差万别,AI模型需要针对具体场景进行微调。未来,随着AI技术的不断进步,领域将越来越多地实现从“人找问题”到“AI找问题”的转变。 人员将扮演更高层次的角色,比如算法调优师或系统架构设计师。结语AI不是替代,而是助力。通过将AI引入瓶颈检测,我们不仅能更快、更准地定位问题,还能让工作从“救火员”转型为“规划师”。

    27610编辑于 2025-04-23
  • 来自专栏北京马哥教育

    故事】小白黑化记

    来源:人那些事儿 ID:jzjytd2016 【01】换工作 2017年8月份的某一个晴朗慵懒的下午,我在望京中环南路7号西家大院E楼5层最角落且紧靠大落地窗的工位上掐指一算,我在研究院竟然已经工作 顶着小伙伴和家人都觉得你脑子进水的诧异目光,我开始了我的换工作大业,从实习开始就在研究院工作,突然开始可以选择了竟然有些茫然,种种纠结波折暂且不表,总之,在2017年12月18号,我走进了东四157号,正式成为了银河信息化集中交易团队的一份子 每每想到这些,我除了自责、懊恼、自我怀疑之外,也深深体会到了团队成员的团结和大家释放出来的善意,对于团队来讲,每天来自业务部门及客户的压力非常大,小心翼翼,如履薄冰,全部精力用来对抗外部还不够,对于团队内部制造麻烦消耗精力的人的态度 这次经历也让我对工作有了新的认识和更多的思考,在这里和大家分享一下: 操作层面 1. 线上操作无小事”,坚持 “双人复核”,坚持“按照流程操作” 端正心态,受过去经历和个人性格的影响,我是一个有一点个人英雄主义倾向的人,来到新的团队,更是急于证明自己,心态出了问题自然会导致路线跑偏,生产系统线上是一个严谨度要求非常高的工作

    2.8K30发布于 2018-06-20
  • 来自专栏智能运维圈

    IT发展进程中不同时期的差异!传统、互联网、业务

    作为IT运行的有力保障,在不同时期和不同类型的企业中正在发挥着越来越大的支撑和引领作用,今天就让我们聊聊信息化时代的传统、互联网时代的互联网维和数字化时代的业务有什么不同! 随着IT规模越来越大、系统越来越复杂,保障工作由最初的硬件不断细分,网络工程师、系统工程师、DBA、安全工程师等岗位加入到体系中,系统管理采用各种重耦合的ITSM、ITOA软件,如IBMTivoli 故障发生时,要求互联网能够第一时间发现问题,并快速进行根因分析,依靠人工巡检的传统管理方式严重落后,自动化逐渐流行。 未来,随着机器学习、深度学习等技术的不断成熟,AI技术将在业务体系中得到广泛的应用,共同推动IT市场的进步,而这就是业务在几年之后发展方向——智能AIOps。 通过不断的数据积累和持续学习,智能AIOps将把人员从纷繁复杂、过度依赖人工的监控、发现、告警和修复工作中彻底解放出来,而也将变得更加自动化、智能化。

    4.5K201发布于 2021-05-11
  • 来自专栏devops_k8s

    管理与自动化

    1 工作有哪些? 7.2 管理文章开头说管理主要目标是标准化/规范化,自动化,可视化/web化,从切身体验来看管理的目标也是随着自动化阶段的不同而变化的。 理由:(1)自动化的价值在于,将从繁琐的、例行、容易发生人为事故的工作中脱离出来,做更有价值的业务维和服务。所以,从这个角度来看,自动化既不是起点,也不是终点。 自动化不是万能的,我们需要看清楚它的位置。(2)的本质到底是服务,是服务于业务,因为是用技术解决业务问题,的价值要依托于业务才能体现。 不是因为技术高深,或者管理了几万台服务器而很牛逼,也不是能玩转很多开源工具而很牛逼,这都不是的关键。对于来说,服务第一,技术第二。

    2.8K60编辑于 2023-07-21
  • 来自专栏AI+运维:智能化运维的未来

    智能维新时代:如何用 AI 彻底优化流程?

    智能维新时代:如何用 AI 彻底优化流程?在这个万物互联的时代,的压力越来越大,系统崩溃、故障预警、日志分析,每一样都能让团队不眠不休。 传统方法已经快要跟不上节奏,而 AI 正在成为解决这些问题的新动力。今天,我们就来聊聊 如何用 AI 优化流程,让不再是“救火队”,而是“智能管家”。一、为什么 AI 可以改变? 通过大数据分析和智能学习,AI 能找到潜在故障,甚至 在问题发生前就解决它。二、AI 在运优化的实际应用让我们来看几个中的关键环节,看看 AI 如何提升效率:1. 自适应自动化:让策略随环境动态调整传统的脚本是死的,设定好的规则不会改变。但 AI策略可以自动优化,比如根据流量情况调整服务器资源、根据业务需求自动部署新实例,让更智能。 三、AI 优化的未来用 AI 进行运优化,不是把人员淘汰,而是 让从繁琐的工作中解放出来,去做更重要的事情,比如提升架构、优化系统设计,而不是天天加班处理故障。

    1.1K00编辑于 2025-05-16
  • 来自专栏六个周

    相关

    服务器配置: 数据库rds、redis、nacos、nginx、node、git、域名、OSS、java、maven 安装Java\maven\nginx\Mysal JAVA yum install java-1.8.0-openjdk : java -version vim /etc/profile.d/java.sh JAVA_HOME=“/usr/lib/jvm/java-1.8.0-openjdk” source /etc/profile.d/java.sh 验证:echo $JA

    3.4K30编辑于 2022-10-28
领券