首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏运维经验分享

    CentOS 7 优化 原

    CentOS 7 优化 一般的,我们安装CentOS mini和其他相应服务后,就能正常工作了。但工作一段时间后,服务器会出现不稳定、被入侵、甚至在突然的高并发时直接瘫痪状况。 所以,在这里提供一些优化的建议。 1.关闭不需要的服务 众所周知,服务越少,系统占用的资源就会越少, 所以应当关闭不需要的服务。 "$tty" = "$X_TTY" ] && continue initctl start tty TTY=$tty done end script 1 2 3 4 5 6 7 echo "IPV6INIT=no" >> /etc/sysconfig/network-scripts/ifcfg-eth0 # 禁用基于IPv6网络,使之不会被触发启动 1 2 3 4 5 6 7 8 7.调整 Linux 的最大文件打开数 要调整一下 Linux 的最大文件打开数,否则运行 Squid 诅服务的机器在高负载时执行性能将会很差;另外,在 Linux 下部署应用时,有时候会遇上 “

    2.8K20发布于 2019-03-11
  • AI接入MCP】

    MCP产品接入AI的案例分析 在云计算和微服务架构盛行的今天,高效成为企业核心需求之一。 MCP(Microservice Control Platform)作为微服务治理平台,结合AI技术实现智能已成为行业趋势。 核心架构设计 MCP的AI模块采用分层设计: 数据层:采集Prometheus指标、ELK日志和Jaeger链路数据 算法层:包含时序预测、异常检测、分类模型等模块 服务层:提供RESTful API 架构支持蓝绿部署模型,确保AI服务高可用。 代码实现示例 1. 某生产环境数据显示,接入AI后年度成本降低28%,系统可用性达到99.99%。

    21010编辑于 2025-12-18
  • 来自专栏AI+运维:智能化运维的未来

    还能“自愈”?聊聊AI加持下的进化

    还能“自愈”?聊聊AI加持下的进化咱们干的都懂,最怕的就是半夜被电话叫醒——“哥,系统挂了!” 而随着AI的结合,这个想法,正一点点变成现实。今天咱们就聊聊:AI结合,怎么搞出一个能自愈的系统?一、为什么需要自愈系统? 传统最大的痛点,就是“人肉救火”:问题发现靠告警:系统挂了,监控发短信,再赶过来。修复速度靠运气:如果是熟悉的问题,几分钟解决;不熟悉的,可能一查就几个小时。 五、我的一点思考很多朋友一听“AI自愈”,就觉得是噱头,好像很玄乎。但我个人的理解是:自愈不是取代,而是帮从重复劳动里解放出来。以前我们要值夜班,守着监控,搞不好一晚上被叫醒好几次。 换句话说,未来的更像是“AI教练”,而不是“救火队员”。六、结语AI结合,本质上是让系统从“被动”变“主动”。以前是出了问题人来修,现在是系统先修,人再优化。

    52910编辑于 2025-08-24
  • 来自专栏东风微鸣技术博客

    AI 可以取代了吗?

    字数 3344,阅读大约需 17 分钟 AI 可以取代了吗? 可以. 只有一个前提: 贵司不是采用"防御式"的策略. 作为一个, 居安思危, 我自然开始认真起来这个问题: AI 可以取代了吗? AI 完美地完成了任务. 毫无缺点. 回答问题 问: AI 可以取代了吗? 答: 可以. (不是部分可以, 而是完全可以, 100% 可以.) 只有一个前提: 贵司不是采用"防御式"的策略. 任何的反模式: • 代码不可见(你的代码不可见, 不在 git repo, 没有CMDB, 没有变更记录) • 配置漂移(你的信息可见, 但是和实际生产环境相比不准) • 孤岛(你的是个孤岛 AI 状态更新更及时 6. AI 考虑的更全面 7. AI 向上管理汇报也更漂亮 8. ...

    12310编辑于 2026-04-02
  • 来自专栏东风微鸣技术博客

    AI 可以取代了吗?

    可以.只有一个前提:贵司不是采用"防御式"的策略.声明:古法匠心,纯人工手工写作本文100%由我手工写作而成本文非AI生成背景AI+AIIDE/CLI取代开发的趋势已经很明显了.作为一个,居安思危 ,我自然开始认真起来这个问题:AI可以取代了吗? .回答问题问:AI可以取代了吗? 任何的反模式:代码不可见(你的代码不可见,不在gitrepo,没有CMDB,没有变更记录)配置漂移(你的信息可见,但是和实际生产环境相比不准)孤岛(你的是个孤岛.是个遗留系统.是上个时代产物 这些,AI学不会,也拿不走。人的价值,不在工具里,而在每一次化险为夷的镇定里。与君共勉.EOF

    11600编辑于 2026-04-01
  • 来自专栏AIOps

    DeepSeek X AI 赋能 IT 审批流变为 AI 工作流

    直达原文:【DeepSeek谈AI 驱动的 IT 管理变革:从审批流到AI工作流摘要: 本文深入探讨了人工智能(AI)技术对 IT 管理流程的深远影响与改造。 (3)人员角色的转变随着 AI 技术在运中的广泛应用,人员的角色将发生转变。 (4)AI 在多领域中的应用拓展除了传统的 IT 领域,AI 技术还将在物联网、云计算、大数据等新兴领域的管理中发挥重要作用。 管理者需要积极拥抱这一变革,深入理解 AI流程的影响,合理规划和实施 AI 驱动的改进策略。 通过不断提升工具的能力、优化流程、培养人员的 AI 技能,企业将能够在数字化时代实现管理的智能化转型,提升自身的竞争力和业务连续性,迎接未来更加复杂的 IT 挑战。

    62410编辑于 2025-04-14
  • 来自专栏织云平台团队的专栏

    智能机器人--AI的实践探索【二】

    同学作为业务运营的主要责任方,岗位作为支撑岗位,而且是7*24小时支撑岗位,其职责要求能够随时随地支持业务——无论是开发同学的紧急需求,还是硬件设备的自身故障。 我们专注于场景,借助于AI技术,开发了智能机器人,为的就是缓解这一矛盾。 登场亮相 什么是智能机器人? 只是开始 在这个AI的东风吹得满世界人心躁动的时代,在这个人人谈AI,处处见AI的时代,我们做智能机器人,确实有着蹭热点的嫌疑。我们也无意去澄清这个嫌疑。 当我们出于降低用户使用门槛的需求而引入了自然语言处理技术后,发现原本单纯的客服账号,瞬间充满了可能性。腾讯织云智能机器人,只是AI在运领域的小试牛刀。 当越来越多的AI技术引入领域后,我们能憧憬,我们的征途,正驶向星辰大海吗?

    6.1K61发布于 2018-03-20
  • 来自专栏博文视点Broadview

    人员7*24值班拯救指南

    人员经常需要在周末出去游玩的时候也带着电脑,因为很多情况下人员需要随时待命。笔者依稀记得2014年左右,我们10多个小伙伴团建时背着5斤重的电脑爬青城山的壮丽场面。 (1)业务线较多,不同的问题得由不同的人员跟进。 (2)开发人员、客服、测试人员都会给人员反馈问题,流程混乱,人员长时间处于被动接受的状态。 ,这种时候值班人员既要承担应急工作,又要执行各种协调任务,效率大打折扣。 01 让开发人员参与其中 不少技术团队的值班体系中只包含人员,极少有开发人员参与,这也导致当故障发生时,人员应急对接开发人员的过程变得不顺畅,再加上开发人员被临时拉进来的时候并没有值班待命状态, (2)业务开发值班人员需要满足7×24小时的待命计划,并且主备两个角色。 (3)正常工作中,参与值班的开发人员的工作需要包含但不仅限于以下内容。

    1.6K20编辑于 2023-08-10
  • 来自专栏腾讯云大数据

    Flink 实践教程-进阶(7):基础

    在正式运行之前请检查:  类名是否有拼写错误 确定是否将相关的业务代码依赖打进 JAR 包中 基础 作业监控 流计算 Oceanus 提供强大的作业监控能力,我们可以通过【监控】项查看作业的各项指标 之后介绍了下作业启动之后的一些基础手段,包括实时监控和告警通知,方便用户及时了解作业的具体运行情况。最后介绍了在作业失败之后通过日志关键字定位问题的方法,具体可以查看 日志诊断指南[6]。 document/product/849/53959 流计算 Oceanus 限量秒杀专享活动火爆进行中↓↓ 点击文末「阅读原文」,了解腾讯云流计算 Oceanus 更多信息~ 腾讯云大数据 长按二

    3.1K11编辑于 2022-01-21
  • 来自专栏DBA随笔

    MongoDB与开发(7)---MongoDB监控

    // MongoDB与开发(7)---MongoDB监控 // MongoDB中自带两个监控的工具,分别是mongostat和mongotop,今天我们看看这两个工具的使用方法。

    1.4K10发布于 2020-11-26
  • AI业务综合支撑系统:引爆AI生产力的智能大脑*

    告警风暴来了,团队在海量日志中“捞针”;业务指标下降了,研发团队却要花上数天排查是数据问题、模型问题还是代码问题。这种“救火式”的,不仅效率低下,更严重拖慢了AI业务的创新步伐。 破局的关键,正是“AI业务综合支撑系统”。它不是一个简单的监控工具,而是一个专为AI业务打造的“智能大脑”。它的核心使命,就是将从被动的“响应者”,升级为主动的“驾驭者”。 全景可视:从“管机器”到“管业务”传统关注CPU、内存、网络。而AI业务综合支撑系统,在此基础上,将目光投向了AI的核心要素:数据、算法、模型。 智能诊断:从“人肉排查”到“AI定位根因”这是系统最“聪明”的地方。它内置了强大的AIOps算法引擎,能够7x24小时不间断地学习系统的正常行为模式。 总结而言,AI业务综合支撑系统,是企业在AI时代不可或缺的基础设施。 它用AI的技术,解决了AI业务的难题,将团队从繁琐的日常中解放出来,更专注于业务创新和模型优化。

    25410编辑于 2025-10-24
  • AI如何赋能IT(AIOps)

    一、AI为什么对IT重要? 传统存在几个痛点:传统痛点AI带来的改变告警量大、难筛选根因AI可识别告警关联性并自动根因定位故障靠人工排查,耗时长模型可溯源日志、抓异常趋势并提前预警经验靠个人积累,不可复制AI沉淀规则→ 变成可复用知识库人工巡检、排障重复度高AI可自动巡检、自动修复脚本闭环AI真正落地价值:节省人力成本、缩短故障恢复时间(MTTR)、减少业务中断风险二、AI赋能IT的核心能力AI功能作用可落地场景日志分析 自动标记磁盘潜在故障→提前7天提醒更换硬盘。 写在最后AI赋能不是概念,而是已能实打实落地的生产力工具。一句总结:AIOps=经验沉淀+自动分析+主动预测+自动修复,最终目标是无人值守与业务持续可用。

    92110编辑于 2025-11-29
  • 来自专栏AIOps

    AI驱动下监控变革:2025AI技术如何重构IT监控产品效率?

    AI技术成为监控的核心突破口——从“被动告警”到“主动预测”,从“经验依赖”到“数据驱动”,AI正在重构效率。 本文围绕“AI功能”,对比主流监控产品的定位、能力与适用场景,并提供企业选型建议及常见问题解答,助力企业精准选择适配监控工具。01. ,融合LLM大模型与AIOps算法,主打“AI+业务”双驱动,同时满足政企信创合规需求。 ,助手直接给出具体配置步骤,新手也能快速上手。 企业选型常见问题与解答FAQQ1:引入AI功能后,会不会增加团队的学习成本?A:优质的AI功能反而会降低门槛,关键看“AI是否贴合习惯”。

    42810编辑于 2025-10-30
  • 来自专栏Cheng's Blog

    】centos7 yum 方式安装nginx

    使用yum安装nginx需要包括Nginx的库,安装Nginx的库 rpm -Uvh http://nginx.org/packages/centos/7/noarch/RPMS/nginx-release-centos -7-0.el7.ngx.noarch.rpm 2.

    82810编辑于 2022-02-25
  • 来自专栏侯哥的Python分享

    MySQL7-Mycat水平分表

    说明6:分片规则使用的是 rule="mod-long" 规则,该规则在rule.xml有定义如下   说明7:继续看 function 中 mod-long 的定义   说明8:这里的count 3的意思是

    70611编辑于 2023-12-18
  • 来自专栏开发运维工程师

    Linux工具|工具7za浅谈

    1、背景前几日,需要从线上环境拉取部分数据导入到实验库,将工作告知后,发给我一些文件,文件内容如下格式:xxx7z.001xxx7z.002xxx7z.003xxx7z.004看到这个第一眼,不知道怎么处理了 ,最后告知需要使用7za工具处理。 命令如下:yum install -y p7zip4、使用方法使用7zip的命令是7za。 Update files to archive x : eXtract files with full paths<Switches> -- : Stop switches parsing -ai Update files to archive x : eXtract files with full paths<Switches> -- : Stop switches parsing -ai

    1.7K41编辑于 2023-11-21
  • 来自专栏AI+运维:智能化运维的未来

    AI赋能:实现任务的智能化自动分配

    引言在现代企业中,团队需要面对复杂的基础设施管理和大量任务的调度问题。从服务器巡检到应用故障修复,工作需要及时、高效且准确地完成。传统的任务分配方式依赖人工,容易导致分配不均、响应迟缓的问题。 而随着人工智能(AI)技术的发展,利用AI实现任务的智能化分配成为可能。本文将详细阐述如何通过AI优化任务分配,并提供具体的代码示例,帮助团队迈向智能化。 案例与效果在一个模拟场景中,通过上述系统,完成了以下优化:任务分配效率提升50%:从传统手工分配的平均5分钟降至2分钟以内。任务完成率提升20%:减少了因任务分配错误导致的延误。 总结AI赋能任务分配不仅提升了效率,还改善了团队协作和用户体验。然而,智能化并不意味着一劳永逸,模型的构建与优化需要结合具体业务场景不断迭代。 希望本文的介绍与示例能为你的团队提供思路,助力实现智能化转型。

    54310编辑于 2025-01-05
  • 来自专栏腾讯云流计算 Oceanus

    Flink 实践教程:进阶7-基础

    在正式运行之前请检查: 类名是否有拼写错误 确定是否将相关的业务代码依赖打进 JAR 包中 基础 作业监控 流计算 Oceanus 提供强大的作业监控能力,我们可以通过【监控】项查看作业的各项指标 之后介绍了下作业启动之后的一些基础手段,包括实时监控和告警通知,方便用户及时了解作业的具体运行情况。最后介绍了在作业失败之后通过日志关键字定位问题的方法,具体可以查看 日志诊断指南[6]。

    3.1K31编辑于 2022-01-20
  • 来自专栏devops_k8s

    的感悟(做需要考虑事,组织结构,学习地图....)

    7.安全防护,不只有ddos,还有登陆问题。 7.谨慎甚微,任何操作琢磨几遍再打,不要随意就打了,比如重启线上nignx用reload,否则当前业务中断了。 (7)资产管理 记录和管理相关的基础物理信息,包括数据中心、网络、机柜、服务器、ACL、IP等各种资源信息,制定有效的流程,确保信息的准确性;开放API接口,为自动化提供数据支持。 (7)自动化系统建设 设计开发数据库自动化维系统,包括数据库部署、自动扩容、分库分表、权限管理、备份恢复、SQL审核和上线、故障切换等功能。 研发 研发负责通用的平台设计和研发工作,如:资产管理、监控系统、平台、数据权限管理系统等。提供各种API供或研发人员使用,封装更高层的自动化维系统。详细的工作职责如下所述。

    8K1011发布于 2020-12-23
  • 来自专栏AI+运维:智能化运维的未来

    AI辅助的风险预测:智能维新时代

    AI辅助的风险预测:智能维新时代在现代 IT 基础架构中,系统的复杂性不断提升,传统的方式已经难以满足高效、精准的风险预测需求。 AI(人工智能)在运中的应用,尤其是在风险预测领域,正在成为企业降本增效、提升稳定性的关键手段。本文将深入探讨 AI 如何辅助风险预测,并通过代码示例展示其实际应用。1. 预测能力不足:传统主要基于经验判断,而非数据驱动,导致预测不准确。AI 通过机器学习和深度学习技术,能够自动分析数据模式、识别异常,并提前预警风险,大幅提升系统稳定性。2. AI的未来发展AI 在运中的应用远不止于故障预测和异常检测,未来还可能朝以下几个方向发展:自适应调优:通过强化学习实现自动化系统调优,提高资源利用率。 自动化决策:通过 AI 学习

    57800编辑于 2025-01-29
领券