首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏后端云

    Kubernetes 记录(5

    (tcp) failed: Cannot assign requested address 实验3:多个目标 ip 相同目标端口 $ nohup nc 220.181.57.216 80 -v & [5]

    83710编辑于 2023-02-10
  • 来自专栏kafka专栏

    5.【kafka】生产者消费组压力测试(5)

    1. 发送1024条消息--num-records 100并且每条消息大小为1KB--record-size 1024 最大吞吐量每秒10000条--throughput 100

    70730发布于 2021-08-06
  • AI接入MCP】

    MCP产品接入AI的案例分析 在云计算和微服务架构盛行的今天,高效成为企业核心需求之一。 MCP(Microservice Control Platform)作为微服务治理平台,结合AI技术实现智能已成为行业趋势。 某案例显示,接入AI后原本需要2小时处理的数据库连接池故障,通过智能分析在5分钟内完成定位。 核心架构设计 MCP的AI模块采用分层设计: 数据层:采集Prometheus指标、ELK日志和Jaeger链路数据 算法层:包含时序预测、异常检测、分类模型等模块 服务层:提供RESTful API 某生产环境数据显示,接入AI后年度成本降低28%,系统可用性达到99.99%。

    33010编辑于 2025-12-18
  • 来自专栏AI+运维:智能化运维的未来

    还能“自愈”?聊聊AI加持下的进化

    还能“自愈”?聊聊AI加持下的进化咱们干的都懂,最怕的就是半夜被电话叫醒——“哥,系统挂了!” 而随着AI的结合,这个想法,正一点点变成现实。今天咱们就聊聊:AI结合,怎么搞出一个能自愈的系统?一、为什么需要自愈系统? 传统最大的痛点,就是“人肉救火”:问题发现靠告警:系统挂了,监控发短信,再赶过来。修复速度靠运气:如果是熟悉的问题,几分钟解决;不熟悉的,可能一查就几个小时。 五、我的一点思考很多朋友一听“AI自愈”,就觉得是噱头,好像很玄乎。但我个人的理解是:自愈不是取代,而是帮从重复劳动里解放出来。以前我们要值夜班,守着监控,搞不好一晚上被叫醒好几次。 换句话说,未来的更像是“AI教练”,而不是“救火队员”。六、结语AI结合,本质上是让系统从“被动”变“主动”。以前是出了问题人来修,现在是系统先修,人再优化。

    62520编辑于 2025-08-24
  • 来自专栏东风微鸣技术博客

    AI 可以取代了吗?

    字数 3344,阅读大约需 17 分钟 AI 可以取代了吗? 可以. 只有一个前提: 贵司不是采用"防御式"的策略. 作为一个, 居安思危, 我自然开始认真起来这个问题: AI 可以取代了吗? AI 完美地完成了任务. 毫无缺点. 回答问题 问: AI 可以取代了吗? 答: 可以. (不是部分可以, 而是完全可以, 100% 可以.) 只有一个前提: 贵司不是采用"防御式"的策略. 任何的反模式: • 代码不可见(你的代码不可见, 不在 git repo, 没有CMDB, 没有变更记录) • 配置漂移(你的信息可见, 但是和实际生产环境相比不准) • 孤岛(你的是个孤岛 AI 100% 圆满地完成了工作, 0人工介入 3. 一个 Coding Plan 月度订阅费大概在 20, 就可以替换掉一个(公司人力成本上万)的同僚 4. AI 文档写的更好 5.

    18710编辑于 2026-04-02
  • 来自专栏侯哥的Python分享

    MySQL5-Mycat配置

    写操作转发到第一个writeHost,第一个挂了,切换到第二个;1:写操作随机发配到配置的writeHost) dbDriver:数据库驱动,支持native和jdbc,native主要支持MySQL5+

    1.1K10编辑于 2023-12-18
  • 来自专栏智能运维圈

    1位5年智能开发对智能的理解

    2019年:进入了千寻的保障部门,接触到了更为庞大的业务。对智能有了进一步的理解。    •《Google SRE解密》:google 关于高可用保障的一本数据;    •赵成的体系管理课(极客时间):关于的经验分享    •《AIOps标准白皮书 对完整的智能解决方案,开始有了自己独特的理解; 总结一下自己的认知过程 12.png 从不同的角度看智能,以质量保障为例   个人认为,智能是一套复杂的人工智能的解决方案。 从业务的角度看智能   首先,智能是建立在运的基础之上的,只有了解了现有的的内容和技术体系,我们才能够合理的思考,智能在整个体系中的地位和作用。    5分钟定位问题 - 10分钟故障恢复;   •故障预测; 从产品的角度看智能   目标群体   智能的使用方,是一群有着丰富经验的专家,但是可能对数据分析、数据挖掘没有任何概念

    2K72发布于 2021-06-25
  • 来自专栏东风微鸣技术博客

    AI 可以取代了吗?

    可以.只有一个前提:贵司不是采用"防御式"的策略.声明:古法匠心,纯人工手工写作本文100%由我手工写作而成本文非AI生成背景AI+AIIDE/CLI取代开发的趋势已经很明显了.作为一个,居安思危 ,我自然开始认真起来这个问题:AI可以取代了吗? .回答问题问:AI可以取代了吗? 任何的反模式:代码不可见(你的代码不可见,不在gitrepo,没有CMDB,没有变更记录)配置漂移(你的信息可见,但是和实际生产环境相比不准)孤岛(你的是个孤岛.是个遗留系统.是上个时代产物 这些,AI学不会,也拿不走。人的价值,不在工具里,而在每一次化险为夷的镇定里。与君共勉.EOF

    19810编辑于 2026-04-01
  • 来自专栏AIOps

    DeepSeek X AI 赋能 IT 审批流变为 AI 工作流

    直达原文:【DeepSeek谈AI 驱动的 IT 管理变革:从审批流到AI工作流摘要: 本文深入探讨了人工智能(AI)技术对 IT 管理流程的深远影响与改造。 5)工具集成与协同的整体要求6)AI应具备的条件要实现上述 AI 驱动的 IT 管理流程改进,大模型需要具备以下条件:(1)模型基础能力规模与知识储备:大模型应具备足够的参数规模和广泛的知识储备,以覆盖 (3)人员角色的转变随着 AI 技术在运中的广泛应用,人员的角色将发生转变。 (4)AI 在多领域中的应用拓展除了传统的 IT 领域,AI 技术还将在物联网、云计算、大数据等新兴领域的管理中发挥重要作用。 管理者需要积极拥抱这一变革,深入理解 AI流程的影响,合理规划和实施 AI 驱动的改进策略。

    71810编辑于 2025-04-14
  • 来自专栏织云平台团队的专栏

    智能机器人--AI的实践探索【二】

    我们专注于场景,借助于AI技术,开发了智能机器人,为的就是缓解这一矛盾。 登场亮相 什么是智能机器人? 只是开始 在这个AI的东风吹得满世界人心躁动的时代,在这个人人谈AI,处处见AI的时代,我们做智能机器人,确实有着蹭热点的嫌疑。我们也无意去澄清这个嫌疑。 这么多人,这么多企业关注AI,投身AI,连国家也将其作为重大战略,不仅仅出于被AI取代,被时代抛弃的恐惧,更是因为无法拒绝AI给我们带来的无穷想象空间。 当我们出于降低用户使用门槛的需求而引入了自然语言处理技术后,发现原本单纯的客服账号,瞬间充满了可能性。腾讯织云智能机器人,只是AI在运领域的小试牛刀。 当越来越多的AI技术引入领域后,我们能憧憬,我们的征途,正驶向星辰大海吗?

    6.2K61发布于 2018-03-20
  • AI业务综合支撑系统:引爆AI生产力的智能大脑*

    然而,当我们兴高采烈地部署了智能推荐、风控模型、AI客服等应用后,一个巨大的挑战也随之而来:这些AI业务,你真的“管”得好吗?传统的模式,在AI业务面前显得力不从心。 告警风暴来了,团队在海量日志中“捞针”;业务指标下降了,研发团队却要花上数天排查是数据问题、模型问题还是代码问题。这种“救火式”的,不仅效率低下,更严重拖慢了AI业务的创新步伐。 破局的关键,正是“AI业务综合支撑系统”。它不是一个简单的监控工具,而是一个专为AI业务打造的“智能大脑”。它的核心使命,就是将从被动的“响应者”,升级为主动的“驾驭者”。 全景可视:从“管机器”到“管业务”传统关注CPU、内存、网络。而AI业务综合支撑系统,在此基础上,将目光投向了AI的核心要素:数据、算法、模型。 总结而言,AI业务综合支撑系统,是企业在AI时代不可或缺的基础设施。 它用AI的技术,解决了AI业务的难题,将团队从繁琐的日常中解放出来,更专注于业务创新和模型优化。

    30610编辑于 2025-10-24
  • AI如何赋能IT(AIOps)

    一、AI为什么对IT重要? 传统存在几个痛点:传统痛点AI带来的改变告警量大、难筛选根因AI可识别告警关联性并自动根因定位故障靠人工排查,耗时长模型可溯源日志、抓异常趋势并提前预警经验靠个人积累,不可复制AI沉淀规则→ 变成可复用知识库人工巡检、排障重复度高AI可自动巡检、自动修复脚本闭环AI真正落地价值:节省人力成本、缩短故障恢复时间(MTTR)、减少业务中断风险二、AI赋能IT的核心能力AI功能作用可落地场景日志分析 (人工值守)改造后(AI自动修复)故障恢复时间MTTR30–60分钟2–5分钟夜间运人力成本>2人值守可降40–70%SLA可用性提升99.80%→99.95%⭐这个是最常落地的能力→成本降低最明显。 写在最后AI赋能不是概念,而是已能实打实落地的生产力工具。一句总结:AIOps=经验沉淀+自动分析+主动预测+自动修复,最终目标是无人值守与业务持续可用。

    1.4K10编辑于 2025-11-29
  • 来自专栏DBA随笔

    Redis开发与学习笔记---(5)

    // Redis开发与学习笔记---(5) // 事务 redis中的事务和MySQL中的事务类似,也是为了保证多条命令组合的原子性,为此,redis提供了简单的事务功能以及集成Lua来解决这个问题 5、消息队列系统,消息队列系统可以说是一个大型网站的必备系统组件,redis提供了发布订阅功能和阻塞队列的功能,虽然和专业的消息队列比还不够抢单,但是对于一般的消息队列功能基本可以满足。

    56210发布于 2020-04-01
  • 来自专栏AIOps

    AI驱动下监控变革:2025AI技术如何重构IT监控产品效率?

    AI技术成为监控的核心突破口——从“被动告警”到“主动预测”,从“经验依赖”到“数据驱动”,AI正在重构效率。 本文围绕“AI功能”,对比主流监控产品的定位、能力与适用场景,并提供企业选型建议及常见问题解答,助力企业精准选择适配监控工具。01. ,融合LLM大模型与AIOps算法,主打“AI+业务”双驱动,同时满足政企信创合规需求。 适用场景:预算有限、网络设备类型少,需简单AI告警的中小型企业或团队。5)Pandora FMS核心定位:全功能开源监控工具,覆盖网络、服务器、应用,主打“综合监控与定制化”。 企业选型常见问题与解答FAQQ1:引入AI功能后,会不会增加团队的学习成本?A:优质的AI功能反而会降低门槛,关键看“AI是否贴合习惯”。

    58810编辑于 2025-10-30
  • 来自专栏互联网老辛

    5 种常用监控工具都不会?你算啥

    来自:马哥Linux 监控工具千千万,仅开源的解决方案就有流量监控(MRTG、Cacti、SmokePing、Graphite 等)和性能告警(Nagios、Zabbix、Zenoss Core 5、Grafana Grafana 是一款采用 go 语言编写的开源应用,主要用于大规模指标数据的可视化展现。 ? Grafana支持许多不同的数据源。

    3.4K21发布于 2021-04-22
  • 来自专栏AI+运维:智能化运维的未来

    AI赋能:实现任务的智能化自动分配

    引言在现代企业中,团队需要面对复杂的基础设施管理和大量任务的调度问题。从服务器巡检到应用故障修复,工作需要及时、高效且准确地完成。传统的任务分配方式依赖人工,容易导致分配不均、响应迟缓的问题。 而随着人工智能(AI)技术的发展,利用AI实现任务的智能化分配成为可能。本文将详细阐述如何通过AI优化任务分配,并提供具体的代码示例,帮助团队迈向智能化。 案例与效果在一个模拟场景中,通过上述系统,完成了以下优化:任务分配效率提升50%:从传统手工分配的平均5分钟降至2分钟以内。任务完成率提升20%:减少了因任务分配错误导致的延误。 总结AI赋能任务分配不仅提升了效率,还改善了团队协作和用户体验。然而,智能化并不意味着一劳永逸,模型的构建与优化需要结合具体业务场景不断迭代。 希望本文的介绍与示例能为你的团队提供思路,助力实现智能化转型。

    68110编辑于 2025-01-05
  • 来自专栏devops_k8s

    的感悟(做需要考虑事,组织结构,学习地图....)

    研发 研发负责通用的平台设计和研发工作,如:资产管理、监控系统、平台、数据权限管理系统等。提供各种API供或研发人员使用,封装更高层的自动化维系统。详细的工作职责如下所述。 从月薪5K到50k 简介 这是一个热门问题,也是很多刚进入工作的同学面临的心境。 今天,我们就通过拉勾上,薪资 5K 到 100K 的招聘要求,来看看从搬砖到大神,都要学习些什么。 这段冲刺期会维持3-5年,会让人感觉每天都有进步,明白的东西越来越多。算是中级了,薪资一线城市可以达到10-20k左右。 高级,一般5-10年经验,薪资15-35k左右 终点 技术是没有终点的,当然可以有你自己的终点。当工作10年,技术已经很厉害了,就需要靠拢一些别的东西了。

    8.5K1011发布于 2020-12-23
  • 来自专栏全栈工程师修炼之路

    Ansible自动化学习笔记5

    : 四舍五入或者取小数点后 random(seed=(ansible_date_time.epoch)),random(start=5),random(start=5,step=3): 随机返回一个随机数并且可以设置步长 msg: "{{ 10 | random(start=5) }}" - debug: #从5到15中随机返回一个随机数,步长为3 #步长为3的意思是返回的随机数只有可能是 5、8、11、14中的一个 msg: "{{ 15 | random(start=5,step=3) }}" - debug: #从0到15中随机返回一个随机数,这个随机数是 5的倍数 msg: "{{ 15 | random(step=5) }}" - debug: #从0到15中随机返回一个随机数,并将ansible_date_time.epoch ] testvar8: [1,[7,2,[15,9]],3,5] testvar9: [1,'b',5] testvar10: [1,'A','b',['QQ','wechat'

    2.9K10编辑于 2022-09-28
  • 来自专栏全栈工程师修炼之路

    Ansible自动化学习笔记5

    : 四舍五入或者取小数点后 random(seed=(ansible_date_time.epoch)),random(start=5),random(start=5,step=3): 随机返回一个随机数并且可以设置步长 msg: "{{ 10 | random(start=5) }}" - debug: #从5到15中随机返回一个随机数,步长为3 #步长为3的意思是返回的随机数只有可能是 5、8、11、14中的一个 msg: "{{ 15 | random(start=5,step=3) }}" - debug: #从0到15中随机返回一个随机数,这个随机数是 5的倍数 msg: "{{ 15 | random(step=5) }}" - debug: #从0到15中随机返回一个随机数,并将ansible_date_time.epoch ] testvar8: [1,[7,2,[15,9]],3,5] testvar9: [1,'b',5] testvar10: [1,'A','b',['QQ','wechat'

    4K11发布于 2020-10-23
  • 来自专栏腾讯专有云

    平台第5期:业务永续

    两项指标分成了6个相应的等级,如下所示: 容灾等级 RTO RPO 第1级 2天以上 1天至7天 第2级 24小时以上 1天至7天 第3级 12小时以上 数小时至1天 第4级 数小时至2天 数小时至1天 第5级 数分钟至2天 0至30分钟 第6级 数分钟 0 为什么需要容灾管理系统 容灾是一个系统工程,不仅仅跟云平台和产品本身的容灾能力有关,还跟实际部署形态、配置、人员技能等强相关。 平台第4期:数据掘金者 专题第3期:诊断专家

    1.4K40编辑于 2022-06-24
领券