搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏kafka专栏
3.【kafka运维】Topic的生产和发送运维脚本(3)
Topic的消费kafka-console-consumer.sh More 日常运维、问题排查怎么能够少了滴滴开源的滴滴开源LogiKM一站式Kafka监控与管控平台 1.Topic的发送默认值) –max-partition-memory-bytes Long 为分区分配的缓冲区大小 16384 –message-send-max-retries Integer 最大的重试发送次数 3 bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --whitelist ‘.*’ --from-beginning 3. kafka.tools.NoOpMessageFormatter、kafka.tools.ChecksumMessageFormatter More Kafka专栏持续更新中…(源码、原理、实战、运维
79920发布于 2021-08-03
【运维AI接入MCP】
MCP产品接入运维AI的案例分析在云计算和微服务架构盛行的今天，高效运维成为企业核心需求之一。 MCP（Microservice Control Platform）作为微服务治理平台，结合AI技术实现智能运维已成为行业趋势。核心架构设计 MCP的AI运维模块采用分层设计：数据层：采集Prometheus指标、ELK日志和Jaeger链路数据算法层：包含时序预测、异常检测、分类模型等模块服务层：提供RESTful API np.random.rand(1000, 24, 10) train_y = np.random.randint(2, size=1000) model.fit(train_X, train_y, epochs=10) 3. 某生产环境数据显示，接入AI运维后年度运维成本降低28%，系统可用性达到99.99%。
33010编辑于 2025-12-18
来自专栏AI+运维：智能化运维的未来
运维还能“自愈”？聊聊AI加持下的运维进化
运维还能“自愈”？聊聊AI加持下的运维进化咱们干运维的都懂，最怕的就是半夜被电话叫醒——“哥，系统挂了！” 而随着AI和运维的结合，这个想法，正一点点变成现实。今天咱们就聊聊：运维与AI结合，怎么搞出一个能自愈的系统？一、为什么需要自愈系统？传统运维最大的痛点，就是“人肉救火”：问题发现靠告警：系统挂了，监控发短信，运维再赶过来。修复速度靠运气：如果是熟悉的问题，几分钟解决；不熟悉的，可能一查就几个小时。五、我的一点思考很多朋友一听“AI自愈”，就觉得是噱头，好像很玄乎。但我个人的理解是：自愈不是取代运维，而是帮运维从重复劳动里解放出来。以前我们要值夜班，守着监控，搞不好一晚上被叫醒好几次。换句话说，未来的运维更像是“AI教练”，而不是“救火队员”。六、结语运维与AI结合，本质上是让系统从“被动”变“主动”。以前是出了问题人来修，现在是系统先修，人再优化。
62520编辑于 2025-08-24
来自专栏python3
Linux运维常用知识（3）
）查看IP（$1代表IP） #cat access_log | awk '{print $1}' （2）对IP排序 #cat access_log | awk '{print $1}'| sort （3） awk '{print $1}'|uniq -c|wc -l > ip.txt （13）查看 access.Log 文件ip统计(从高到低) cat access.log |awk '{print $3} (3) 端口不通时发送邮件 # vim /scripts/ncports.sh #! /bin/bash #denyhost ip cat /var/log/secure|egrep -i -o "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3 > $fileRfc done tail /sys/class/net/eth*/queues/rx-*/{rps_cpus,rps_flow_cnt} 补充一些知识： Linux运维常见系统服务介绍
29.3K34发布于 2020-01-08
来自专栏python3
日常运维 3
crontab -e 编辑任务计划 crontab -l(小写的L) 列出任务计划 crontab -r 删除 crontab -u [username] 指定某个用户 1-5 表示范围1到5 1,2,3 --level 34 network off/on 控制network的等级3和4开关 --add [servicename] 增加一行服务，前提是在/etc/init.d/目录下有文件 --del [
89420发布于 2020-01-14
来自专栏东风微鸣技术博客
AI 可以取代运维了吗?
字数 3344，阅读大约需 17 分钟 AI 可以取代运维了吗? 可以. 只有一个前提: 贵司不是采用"防御式运维"的策略. 作为一个运维, 居安思危, 我自然开始认真起来这个问题: AI 可以取代运维了吗? AI 完美地完成了任务. 毫无缺点. 回答问题问: AI 可以取代运维了吗? 答: 可以. (不是部分可以, 而是完全可以, 100% 可以.) 只有一个前提: 贵司不是采用"防御式运维"的策略. 任何运维的反模式: • 运维代码不可见(你的运维代码不可见, 不在 git repo, 没有CMDB, 没有变更记录) • 配置漂移(你的运维信息可见, 但是和实际生产环境相比不准) • 孤岛(你的运维是个孤岛 AI 100% 圆满地完成了工作, 0人工介入 3. 一个 Coding Plan 月度订阅费大概在 20, 就可以替换掉一个(公司人力成本上万)的运维同僚 4. AI 文档写的更好 5.
18710编辑于 2026-04-02
来自专栏kafka专栏
3.【kafka运维】Topic的生产和消费运维脚本
Topic的消费kafka-console-consumer.sh 3. 持续批量推送消息kafka-verifiable-producer.sh 4. 持续批量拉取消息kafka-verifiable-consumer More 日常运维、问题排查怎么能够少了滴滴开源的滴滴开源LogiKM一站式Kafka监控与管控平台 1.Topic的发送默认值) –max-partition-memory-bytes Long 为分区分配的缓冲区大小 16384 –message-send-max-retries Integer 最大的重试发送次数 3 bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --whitelist ‘.*’ --from-beginning 3. kafka.tools.LoggingMessageFormatter、kafka.tools.NoOpMessageFormatter、kafka.tools.ChecksumMessageFormatter 3.
1K20编辑于 2022-04-13
来自专栏东风微鸣技术博客
AI 可以取代运维了吗?
可以.只有一个前提:贵司不是采用"防御式运维"的策略.声明:古法匠心,纯人工手工写作本文100%由我手工写作而成本文非AI生成背景AI+AIIDE/CLI取代开发的趋势已经很明显了.作为一个运维,居安思危 ,我自然开始认真起来这个问题:AI可以取代运维了吗? .回答问题问:AI可以取代运维了吗? 任何运维的反模式:运维代码不可见(你的运维代码不可见,不在gitrepo,没有CMDB,没有变更记录)配置漂移(你的运维信息可见,但是和实际生产环境相比不准)孤岛(你的运维是个孤岛.是个遗留系统.是上个时代产物这些，AI学不会，也拿不走。运维人的价值，不在工具里，而在每一次化险为夷的镇定里。与君共勉.EOF
19810编辑于 2026-04-01
来自专栏AIOps
DeepSeek X 运维：AI 赋能 IT 运维审批流变为 AI 工作流
（3）数据驱动的决策与优化AI 技术的核心是数据，在事件管理流程中，AI 通过对大量历史事件数据和实时运维数据的分析，为运维决策提供了有力支持。（3）智能知识管理与复用AI 可以将问题的分析过程、解决方案以及处理结果等信息自动整理成知识，存储在知识库中。当再次遇到类似问题时，AI 能够快速从知识库中检索出相关解决方案，提供给运维人员参考。（3）资源智能分配与调度AI 可以根据服务请求的优先级、复杂程度、处理时间等因素，结合运维资源的实时状态，智能分配和调度运维资源。（3）用户交互与可视化智能界面优化：通过 AI 推荐常用操作、自动化填充表单字段，提升用户效率。可视化分析看板：展示 AI 生成的运维洞察（如故障预测趋势、流程瓶颈分析）。（3）运维人员角色的转变随着 AI 技术在运维中的广泛应用，运维人员的角色将发生转变。
71810编辑于 2025-04-14
来自专栏织云平台团队的专栏
智能运维机器人--AI运维的实践探索【二】
我们专注于运维场景，借助于AI技术，开发了智能运维机器人，为的就是缓解这一矛盾。登场亮相什么是智能运维机器人？只是开始在这个AI的东风吹得满世界人心躁动的时代，在这个人人谈AI，处处见AI的时代，我们做智能运维机器人，确实有着蹭热点的嫌疑。我们也无意去澄清这个嫌疑。这么多人，这么多企业关注AI，投身AI，连国家也将其作为重大战略，不仅仅出于被AI取代，被时代抛弃的恐惧，更是因为无法拒绝AI给我们带来的无穷想象空间。当我们出于降低用户使用门槛的需求而引入了自然语言处理技术后，发现原本单纯的运维客服账号，瞬间充满了可能性。腾讯织云智能运维机器人，只是AI在运维领域的小试牛刀。当越来越多的AI技术引入运维领域后，我们能憧憬，我们的征途，正驶向星辰大海吗？
6.2K61发布于 2018-03-20
AI业务综合运维支撑系统：引爆AI生产力的智能运维大脑*
告警风暴来了，运维团队在海量日志中“捞针”；业务指标下降了，研发团队却要花上数天排查是数据问题、模型问题还是代码问题。这种“救火式”的运维，不仅效率低下，更严重拖慢了AI业务的创新步伐。破局的关键，正是“AI业务综合运维支撑系统”。它不是一个简单的监控工具，而是一个专为AI业务打造的“智能运维大脑”。它的核心使命，就是将运维从被动的“响应者”，升级为主动的“驾驭者”。全景可视：从“管机器”到“管业务”传统运维关注CPU、内存、网络。而AI业务综合运维支撑系统，在此基础上，将目光投向了AI的核心要素：数据、算法、模型。 3. 预测性维护：从“事后补救”到“事前预警”最高级的运维，是让故障不发生。该系统通过对历史数据的学习，能够预测未来的风险。总结而言，AI业务综合运维支撑系统，是企业在AI时代不可或缺的基础设施。它用AI的技术，解决了AI业务的运维难题，将团队从繁琐的日常运维中解放出来，更专注于业务创新和模型优化。
30610编辑于 2025-10-24
来自专栏python3
运维的shell小编（3）
dd if=infile.log of=outfile.log bs=1M count=1
66610发布于 2020-01-09
AI如何赋能IT运维（AIOps）
一、AI为什么对IT运维重要？传统运维存在几个痛点：传统运维痛点AI带来的改变告警量大、难筛选根因AI可识别告警关联性并自动根因定位故障靠人工排查，耗时长模型可溯源日志、抓异常趋势并提前预警运维经验靠个人积累，不可复制AI沉淀规则→ 变成可复用知识库人工巡检、排障重复度高AI可自动巡检、自动修复脚本闭环AI真正落地价值：节省人力成本、缩短故障恢复时间（MTTR）、减少业务中断风险二、AI赋能IT运维的核心能力AI功能作用可落地场景日志分析价值：✔避免数据库节点宕机✔保障核心账单业务不出现停机✔形成长期健康评分体系案例3：AI自动化运维闭环–服务异常自动恢复目标异常发生后不依赖人工处理，形成无人值守自动修复系统。写在最后AI赋能运维不是概念，而是已能实打实落地的生产力工具。一句总结：AIOps=经验沉淀+自动分析+主动预测+自动修复，最终目标是无人值守与业务持续可用。
1.4K10编辑于 2025-11-29
来自专栏AIOps
AI驱动下运维监控变革：2025AI技术如何重构IT监控产品运维效率？
AI技术成为运维监控的核心突破口——从“被动告警”到“主动预测”，从“经验依赖”到“数据驱动”，AI正在重构运维效率。本文围绕“AI功能”，对比主流运维监控产品的定位、能力与适用场景，并提供企业选型建议及常见问题解答，助力企业精准选择适配运维监控工具。01. （3）特色能力全栈信创适配：兼容国产操作系统（UOS/欧拉）、数据库（达梦/人大金仓）、硬件（华为/浪潮），满足政企合规；业务级观测：基于联机日志提取交易量、成功率等业务指标，绘制业务拓扑，让运维直接感知业务健康度 3）SolarWinds NPM（1）核心定位专注“网络设备性能监控”，以AI提升网络故障定位效率，覆盖多厂商设备管理，主打“网络运维专项化”。企业选型常见问题与解答FAQQ1：引入AI运维功能后，会不会增加运维团队的学习成本？A：优质的AI运维功能反而会降低门槛，关键看“AI是否贴合运维习惯”。
58810编辑于 2025-10-30
来自专栏AI+运维：智能化运维的未来
AI赋能运维：实现运维任务的智能化自动分配
引言在现代企业中，运维团队需要面对复杂的基础设施管理和大量任务的调度问题。从服务器巡检到应用故障修复，运维工作需要及时、高效且准确地完成。传统的任务分配方式依赖人工，容易导致分配不均、响应迟缓的问题。而随着人工智能（AI）技术的发展，利用AI实现运维任务的智能化分配成为可能。本文将详细阐述如何通过AI优化运维任务分配，并提供具体的代码示例，帮助运维团队迈向智能化。案例与效果在一个模拟运维场景中，通过上述系统，完成了以下优化：任务分配效率提升50%：从传统手工分配的平均5分钟降至2分钟以内。任务完成率提升20%：减少了因任务分配错误导致的延误。总结AI赋能运维任务分配不仅提升了效率，还改善了团队协作和用户体验。然而，智能化并不意味着一劳永逸，模型的构建与优化需要结合具体业务场景不断迭代。希望本文的介绍与示例能为你的运维团队提供思路，助力实现智能化转型。
68110编辑于 2025-01-05
来自专栏腾讯专有云
运维专题第3期：诊断专家
在上一期《运维专题第2期：警戒哨兵》中，我们介绍的是运维平台中的监控系统——云哨，今天给大家带来的产品是巡检平台，在运维过程中能够跟监控系统一起为客户带来稳定的保障。这样的产品哪里有来腾讯专有云，给你不一样的运维服务体验。笔者认为，首先是易用性，运维产品化也应该遵循产品设计的体验好和易用的要求，运维产品能做到开箱即用就是基本要求；其次，是自定义能力，因为运维产品是面向运维人员，在 DevOps 潮流的今天，很多运维人员都有一定开发能力，那自定义开发的能力也可以是好的运维产品的能力，从而做到运维产品特性的快速扩展；最后，是智能化，能够针对初级运维人员提供快速解决运维问题的能力，比如自动分析故障、有针对性提供知识库，让运维工作做到高效，提高产品SLA，这是运维工作的关键目标。
1.1K10编辑于 2022-06-24
来自专栏DBA随笔
Redis开发与运维学习笔记---(3)
127.0.0.1:6379> exit 这里对其他的参数做一下说明： -r -r(repeat)选项代表将命令执行多次 [root@VM_48_10_centos ~]# redis-cli -r 3 (interval)选项代表每隔几秒执行一次命令，但是-i选项必须和-r选项一起使用，下面每隔1s执行一次ping命令： [root@VM_48_10_centos ~]# redis-cli -r 3 --latency 该参数有3个选项，分别是--latency，--latency-history以及--latency-dist，其中： --latency选项可以测试客户端到目标redis的网络延迟 latency-dist会使用统计表的形式从控制台输出延迟统计信息 --stat 该选项可以试试获取Redis的重要统计信息，虽然info命令中的统计信息更全，但是能够实时看到一些增量数据，对于redis的运维还是有一定帮助例如： redis-server --port 6380 3、配置文件启动 redis-server /dir/redis.conf 除了启动redis之外，还有一个选项--test-memory，
58320发布于 2020-03-31
来自专栏devops_k8s
做运维的感悟(做运维需要考虑事,运维组织结构,运维学习地图....)
确实，【运维】可能是分水岭最明显的职位之一：有的人毕业6年，月薪从3K涨到到50K；有的人工作4年，依然做着重启服务器、检查机房的机械工作，这都是知乎上能看到的真实事例。招聘岗位和要求 /* 岗位一：岗位职责：公司电脑多媒体以及网络日常维护，以及桌面运维支持任职资格： 1、能熟练更换PC硬件 2、熟悉办公常用软件以及邮箱 3、对网络运维方面有一定了解招聘岗位和要求 /* 【岗位职责】： 1，负责服务器的配置、维护、监控、调优，故障排除等； 2，运维自动化及运维脚本开发； 3，大用户量下高性能服务器系统部署方案的制定及实施与监控； 3、探索、研究新的运维技术方向。这段冲刺期会维持3-5年，会让人感觉每天都有进步，明白的东西越来越多。算是中级运维了，薪资一线城市可以达到10-20k左右。
8.5K1011发布于 2020-12-23
来自专栏Apache IoTDB
Apache IoTDB 系列教程-3：部署运维
今天介绍 IoTDB 的部署运维相关知识，帮助大家玩转 IoTDB！正文 1859 字，预计阅读时间 5 分钟。开箱即用 IoTDB 的理念就是系统运维要简单，要一键启动、开箱即用。 nohup sbin/start-server.sh >/dev/null 2>&1 & 目录结构使用默认配置启动并且写数据之后，项目根目录会生成下面这些文件夹，都在 data 目录下：其中主要包括 3 3. 把 A 机器上的 IoTDB 的元数据迁移到 B 机器上，但是不要数据把 A 机器的 data/system 目录拷贝到 B 机器的相应位置，启动 B 机器的 IoTDB 即可。
2.1K30发布于 2020-09-27
来自专栏AI+运维：智能化运维的未来
AI辅助的运维风险预测：智能运维新时代
AI辅助的运维风险预测：智能运维新时代在现代 IT 基础架构中，系统的复杂性不断提升，传统的运维方式已经难以满足高效、精准的风险预测需求。 AI（人工智能）在运维中的应用，尤其是在风险预测领域，正在成为企业降本增效、提升稳定性的关键手段。本文将深入探讨 AI 如何辅助运维风险预测，并通过代码示例展示其实际应用。1. 预测能力不足：传统运维主要基于经验判断，而非数据驱动，导致预测不准确。AI 通过机器学习和深度学习技术，能够自动分析数据模式、识别异常，并提前预警运维风险，大幅提升系统稳定性。2. 3. AI运维的未来发展AI 在运维中的应用远不止于故障预测和异常检测，未来还可能朝以下几个方向发展：自适应调优：通过强化学习实现自动化系统调优，提高资源利用率。自动化运维决策：通过 AI 学习
67500编辑于 2025-01-29

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

3.【kafka运维】Topic的生产和发送运维脚本(3)

【运维AI接入MCP】

运维还能“自愈”？聊聊AI加持下的运维进化

Linux运维常用知识（3）

日常运维 3

AI 可以取代运维了吗?

3.【kafka运维】Topic的生产和消费运维脚本

AI 可以取代运维了吗?

DeepSeek X 运维：AI 赋能 IT 运维审批流变为 AI 工作流

智能运维机器人--AI运维的实践探索【二】

AI业务综合运维支撑系统：引爆AI生产力的智能运维大脑*

运维的shell小编（3）

AI如何赋能IT运维（AIOps）

AI驱动下运维监控变革：2025AI技术如何重构IT监控产品运维效率？

AI赋能运维：实现运维任务的智能化自动分配

运维专题第3期：诊断专家

Redis开发与运维学习笔记---(3)

做运维的感悟(做运维需要考虑事,运维组织结构,运维学习地图....)

Apache IoTDB 系列教程-3：部署运维

AI辅助的运维风险预测：智能运维新时代

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐