搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏北京马哥教育
运维 | 运维好数据中心的四大法宝
对于数据中心，运维工作的重要性不言而喻，在数据中心生命周期中运维管理是历时时间最长的一个阶段。投资巨大的数据中心，为了能够尽快得到收益，就需要在运维的工作上多下工夫，切勿进入“一流设备、二流设计、三流运维”的不良运营之中，高品质数据中心运维的工作至关重要。那么如何才能提升数据中心的运维水平，本文提出了数据中心运维工作制胜的四大法宝，做好这四个方面的工作将使数据中心一直运行于最佳状态，为数据中心创造最大的受益。通过对数据中心运维而输出的各种技术文档，将为后来人提供方便，并且可以提升数据中心整体的运维能力。数据中心的文档五华八门，你不知道什么时候其中的哪些文档就会派上用场。工程文档、业务备份、在线监测、周期巡检是数据中心运维工作的四个重要方面，只有做好这四个方面的工作，才能让数据中心保持长期稳定运行，并能产生良好的效益，是数据中心运维水平高低的主要体现，拥有这四大法宝，将使数据中心终身受益
3.9K70发布于 2018-05-02
来自专栏AI+运维：智能化运维的未来
大模型进驻运维战场：运维数据处理的智能革命
大模型进驻运维战场：运维数据处理的智能革命在传统运维工作中，数据处理一直是个让人头疼的问题——日志分析、异常检测、告警优化，各种数据纷至沓来，往往让运维人员不堪重负。如今，大模型技术正在悄然改变这一现状，让运维不再是靠经验“拍脑袋”，而是依赖数据驱动的智能决策。今天，我们就来聊聊大模型技术在运维数据处理中的应用，看看它到底能帮运维人员省多少力。运维数据为何需要大模型？应用场景3：智能告警优化告警泛滥是运维人员的噩梦，但大模型可以通过智能分类和聚合，让告警更精准。运维人员的工作将逐步从“疲于奔命”变为“智能运维”，让数据真正服务于业务增长。总结大模型技术的引入，让运维数据处理迈向智能化。
60210编辑于 2025-05-25
来自专栏kafka专栏
3.【kafka运维】Topic的生产和发送运维脚本(3)
Topic的消费kafka-console-consumer.sh More 日常运维、问题排查怎么能够少了滴滴开源的滴滴开源LogiKM一站式Kafka监控与管控平台 1.Topic的发送默认值) –max-partition-memory-bytes Long 为分区分配的缓冲区大小 16384 –message-send-max-retries Integer 最大的重试发送次数 3 –metadata-expiry-ms Long 强制更新元数据的时间阈值(ms) 300000 –producer-property String 将自定义属性传递给生成器的机制如：key=value bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --whitelist ‘.*’ --from-beginning 3. kafka.tools.NoOpMessageFormatter、kafka.tools.ChecksumMessageFormatter More Kafka专栏持续更新中…(源码、原理、实战、运维
72220发布于 2021-08-03
来自专栏祝威廉
运维=平台+数据
运维会比开发更加重要运维的发展日新月异，曾几何时，运维仅仅是被认知为跑机房，装系统，设计网络，给开发擦屁股。但是现在运维变得极度重要，运维职责也更加细化，譬如稍大点的公司就将运维划分为基础运维，网络运维，DBA, 应用运维，架构师。运维发展新方向之前我写过一篇文章，谈及如何用大数据思维做运维，当然这篇文章有他自己的局限性，只是谈及了运维监控，灌输一种 data based 的理念。一切服务都是为了帮助数据进行流转和变换，服务的状态也都反应在数据流上，这种瞬态和终态的量是非常大的，所以我们需要借助大数据的思维去做处理。到这里就可以参考大数据思维做运维灌输的概念了。所以未来运维可以完全依托一个固定的分布式操作系统，在其上开发各种运维工具，利用大数据相关的理念和工具，监控，追踪，分析服务的状态，解决现有的运维工具碎片化，难以复制，难于贡献生态的问题。
4.2K50发布于 2018-08-27
来自专栏织云平台团队的专栏
腾讯云运维干货沙龙-海量运维实践大曝光（三）
12月16日，首期沙龙“海量运维实践大曝光”在腾讯大厦圆满举行。一、活动背景 [图片] 运维有三座大山：大活动、大变更、大故障。这几个运维场景是最消耗运维人力的。特别是大活动，非常考验弹性能力，对运维自动化挑战很大。我今天所分享的主题就是深入百亿次红包大活动的背后，解析腾讯运维的方法体系，了解织云平台如何帮助运维实现大活动高效运维，如何减少运维人海战术。根据运营指标，运维按历史性能数据、容量模型和业务架构，评估出春节活动需要2万台虚拟机和3千台数据库服务器扩容支撑。节前恰好遇到厂商内存供货问题，服务器供应非常紧张，采购比原计划延期了一个多月。相关文章腾讯云运维干货沙龙-海量运维实践大曝光（一）腾讯云运维干货沙龙-海量运维实践大曝光（二）沙龙PPT下载地址： https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3
6.2K10发布于 2017-12-17
来自专栏织云平台团队的专栏
腾讯云运维干货沙龙-海量运维实践大曝光（二）
作者丨魏旸：腾讯高级工程师，具有15年运维经验的专家。负责QQ空间、微云、QQ空间相册等的运维工作。 12月16日，首期沙龙“海量运维实践大曝光”在腾讯大厦圆满举行。沙龙出品人腾讯运维技术总监、复旦大学客座讲师、DevOps专家梁定安，讲师腾讯手机QQ运维负责人郭智文，腾讯高级工程师魏旸，腾讯SNG资深运维专家周小军出席沙龙，并带来精彩的技术分享。 1）名称分为2段，用“_”分割；第1段固定为SET，表示专区； 2）第二段分为4节，每节占一位，前3位与目前规则一致： 3） SET类型，简写为A、D 、B、I，分别代表接入、数据SET、基础数据， SET，用一个字母代替，如P、G、U分别代表如PENGYOU、3G、UGC等 [图片] 同步中心同步中心是空间业务SET化能力的一个重要组件，业务数据的同步都依赖同步中心。 [图片] [图片] 相关文章腾讯云运维干货沙龙-海量运维实践大曝光（一）腾讯云运维干货沙龙-海量运维实践大曝光（三）沙龙PPT下载地址： https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3
9.4K10发布于 2017-12-17
来自专栏织云平台团队的专栏
腾讯云运维干货沙龙-海量运维实践大曝光（一）
作者丨郭智文：腾讯高级工程师，手机QQ运维负责人。 12月16日，首期沙龙“海量运维实践大曝光”在腾讯大厦圆满举行。沙龙出品人腾讯运维技术总监、复旦大学客座讲师、DevOps专家梁定安，讲师腾讯手机QQ运维负责人郭智文，腾讯高级工程师魏旸，腾讯SNG资深运维专家周小军出席沙龙，并带来精彩的技术分享。移动端网络性能优化通信信道预激活 —- signaling加速从统计数据看，在3G网络下，这个优化是可以把用户感知这个体验从600多毫秒降到400多毫秒，平均耗时减少了32%左右。总结相关文章腾讯云运维干货沙龙-海量运维实践大曝光（二）腾讯云运维干货沙龙-海量运维实践大曝光（三）沙龙PPT下载地址： https://share.weiyun.com
6K30发布于 2017-12-17
来自专栏python3
日常运维 3
crontab -e 编辑任务计划 crontab -l(小写的L) 列出任务计划 crontab -r 删除 crontab -u [username] 指定某个用户 1-5 表示范围1到5 1,2,3 --level 34 network off/on 控制network的等级3和4开关 --add [servicename] 增加一行服务，前提是在/etc/init.d/目录下有文件 --del [
81220发布于 2020-01-14
来自专栏python3
Linux运维常用知识（3）
ESTABLISHED 1597 　　FIN_WAIT1 51 　　FIN_WAIT2 504 　　TIME_WAIT 1057 其中的SYN_RECV表示正在等待处理的请求数；ESTABLISHED表示正常数据传输状态 yum install -y nc [root@server ~]# rpm -qa nc nc-1.84-22.el6.x86_64 一、nc命令检测端口的用法 -s<来源地址> 设置本地主机送出数据包的 /bin/bash #denyhost ip cat /var/log/secure|egrep -i -o "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3 > $fileRfc done tail /sys/class/net/eth*/queues/rx-*/{rps_cpus,rps_flow_cnt} 补充一些知识： Linux运维常见系统服务介绍它自动收集系统数据分析使用模式，将工作状态置于performance mode和power-save mode二种模式。
28.8K34发布于 2020-01-08
来自专栏kafka专栏
3.【kafka运维】Topic的生产和消费运维脚本
Topic的消费kafka-console-consumer.sh 3. 持续批量推送消息kafka-verifiable-producer.sh 4. 持续批量拉取消息kafka-verifiable-consumer More 日常运维、问题排查怎么能够少了滴滴开源的滴滴开源LogiKM一站式Kafka监控与管控平台 1.Topic的发送 –metadata-expiry-ms Long 强制更新元数据的时间阈值(ms) 300000 –producer-property String 将自定义属性传递给生成器的机制如：key=value 0、1(默认值)、all –request-timeout-ms Integer 生产者请求的确认超时时间 1500(默认值) –retry-backoff-ms Integer 生产者重试前，刷新元数据的等待时间阈值 value.deserializer> --from-beginning 从存在的最早消息开始，而不是从最新消息开始,注意如果配置了客户端名称并且之前消费过，那就不会从头消费了 --max-messages 消费的最大数据量
94720编辑于 2022-04-13
来自专栏大模型
大模型在蓝鲸运维体系应用——蓝鲸运维开发智能助手
3、语言创作大模型能够根据输入的上下文信息生成连贯、流畅的文本，例如撰写文章、生成对话、创作诗歌或故事等。大模型在运维开发上的应用从大模型的原理上看，模型经过海量的数据训练，在开发领域，很多大模型学习了几十亿行代码，庞大的数据基础使得这些模型在代码的规范性、准确性方面展现出了卓越的效果。 3、专业知识问答大模型天然在自然语言理解和知识总结有巨大的优势，而嘉为蓝鲸又有上千家各行各业的企业运维解决方案实施经验，积累了海量的运维开发领域专业知识。 5、运维开发平台集成最后，在低代码开发领域，运维开发平台的优势在于图形化开发方式、大量的预制组件、少量手工编码、实现完整的应用（包含页面、流程、数据等），可以降低开发难度、开发成本，缩短开发周期，但是也存在产品学习成本高的功能；运维开发平台将数据库表结构和用户输入文本进行格式化整合后，经过 Prompt 优化后发送到大模型；大模型返回 SQL 语句，用户复制或插入到平台中。
1.3K01编辑于 2024-05-27
来自专栏千帆企业应用连接器
IT运维大咖带你玩转企业信息运维自动化
但是小到企业设备、系统的运维；大到企业的多个信息系统的规划、选型、建立整体的业务数据中台，企业的IT信息化部门，是“IT里最懂本企业的业务，又是懂业务的人里IT技术最强的”存在，也在越来越多的企业数字化转型中担任着重要的选型非典型IT运维负责人王焱焱是一位非典型IT运维负责人，热爱电脑的他从中学就开始折腾3C设备，并且自主参加了IT技术的培训。零代码玩转IT运维自动化王焱焱爱琢磨，爱学习，爱分享。集团的IT运维工作中，有许多重复琐碎却价值低的工作，他一直在思考，在自己的工作中，如何去不断优化。第一次接触腾讯云HiFlow场景连接器里，是接触到了，可以零代码实现企业微信群机器人的能力，IT运维自动化终极攻略今晚等你你来听！零代码打造灵活运维值班自动化？IT知识库更新及时提醒？企业软硬件运维自动告警？
64030编辑于 2022-09-28
大模型在蓝鲸运维体系应用——蓝鲸运维开发智能助手
3、语言创作大模型能够根据输入的上下文信息生成连贯、流畅的文本，例如撰写文章、生成对话、创作诗歌或故事等。大模型在运维开发上的应用从大模型的原理上看，模型经过海量的数据训练，在开发领域，很多大模型学习了几十亿行代码，庞大的数据基础使得这些模型在代码的规范性、准确性方面展现出了卓越的效果。 3、专业知识问答大模型天然在自然语言理解和知识总结有巨大的优势，而嘉为蓝鲸又有上千家各行各业的企业运维解决方案实施经验，积累了海量的运维开发领域专业知识。 5、运维开发平台集成最后，在低代码开发领域，运维开发平台的优势在于图形化开发方式、大量的预制组件、少量手工编码、实现完整的应用（包含页面、流程、数据等），可以降低开发难度、开发成本，缩短开发周期，但是也存在产品学习成本高的功能；2.运维开发平台将数据库表结构和用户输入文本进行格式化整合后，经过 Prompt 优化后发送到大模型；3.大模型返回SQL语句，用户复制或插入到平台中。
1.2K10编辑于 2024-11-13
来自专栏个人总结系列
指标数据运维流程
现状针对目前大数据异常响应效率低，解决处理定位难，运维压力集中在某几个人等不合理的现状。针对技术组件方向，建立大数据技术保障组，异常谁发现谁报备到保障组并@组件负责人，组件负责人根据实际情况，业务重要程度，是否发起团队能力协助处理来主要负责处理。二. 异常奖励机制，待完善事项积分异常报备 1 异常讨论，提供异常解决内容 1 异常关键信息，如果最终异常解决是这部分内容 3 异常处理，谁解决谁立功 5 每月总结查看文档记录和积分情况，
1.3K00发布于 2021-08-14
来自专栏python3
运维的shell小编（3）
3.5 sort命令 Sort是进行排序的命令，格式是：Sort 【-fnrutk 】 file 参数f忽略大小写，n以纯数字排序，r反向排序，u相同数据仅取一行，t分隔符默认tab，k分区间。
61410发布于 2020-01-09
来自专栏散尽浮华
运维相关指标数据采集并ES入仓 - 运维笔记
收集到的应用指标数据最好要进行ES入仓，入到Kafka里面，并通过Kibana可视化展示。需要进行采集的应用进程相关指标如下： ? 指标值 indexValue CHAR 是支持批量指标类别 indexType CHAR 是安全测试运行应用环境指标描述 indexDesc VARCHAR 是指标说明，指标采集数据源否发送数据源主机 dataSource CHAR 是脚本路径@主机IP 下面是应用指标数据进行ES入仓的请求说明测试区接口说明：访问链接：http://192.168.10.10:10222 topdown --可选，为True或者没有指定, 一个目录的的3-元组将比它的任何子文件夹的3-元组先产生 (目录自上而下)。如果topdown为 False, 一个目录的3-元组将比它的任何子文件夹的3-元组后产生 (目录自下而上)。
1.7K31发布于 2019-07-08
来自专栏james大数据架构
徒手教你制作运维监控大屏
在公司开发人员资源紧张的情况下，想要快速搭建起一套运维大屏可以使用Grafana。　　Grafana 是一个开源的监控数据分析和可视化套件。综合大屏展示　　以上内容都是分模块的，现在想把服务器、业务访问流量、容器状态放在一个大屏内显示，每一块都来各自的数据源。关键在于一块大屏要展示哪些关键信息，摈弃掉无关紧要的内容，下面是其中一个大屏，具体制作方式与上面一样，其中图形大小与布局需要根据投影到大屏上的分辨率有关，需要现场调试。 ? 关于大屏展示的技巧 Grafana提供一个大屏展示轮播功能，几个看板之间自动切换，具体就是Playlists。 ? 给大屏一个名字，和切换间隔，然后将需要轮播的看板加入。 ? Grafana还可对接很多数据源，需要自行去探索，有能力的可以进行二次开发，打造自己的监控大屏。
4K41发布于 2020-06-19
来自专栏运维前线
系统运维五大要素
https://blog.csdn.net/wh211212/article/details/53199058 系统运维五大要素如今的互联网是一个巨大的变幻莫测的世界，每个站点、每个应用程序要想在21世纪取得 24x7运维和系统成功的话，关键是要能够理解并合理地关注这五大要素。运维监控包括：常规的 CPU、RAM、以及磁盘输入/输出监控，还包括对许多与网络服务器、应用程序和代码、数据库等相关的特定服务问题的监控，重点是对能够提高和/或降低大型系统性能的关键变量进行监控这种做法也能够帮助程序开发员和运维团队成员强行地把安全观牢记在心。要想在21世纪取得运维成功和系统成功的话，关键是要能够理解并合理地关注这五大要素。
4K20发布于 2019-05-26
来自专栏hadoop学习
深度解析大快DKM大数据运维管理平台功能
深度解析大快DKM大数据运维管理平台功能之前几周的时间一直是在围绕DKhadoop的运行环境搭建写分享，有一些朋友留言索要了dkhadoop安装包，不知道有没有去下载安装一探究竟。关于DKHadoop下载安装基本已经讲清楚了，这几天有点空闲把大快DKM大数据运维管理平台的内容整理了一些，作为DKHadoop相配套的管理平台，是有必要对DKM有所了解的。通过DKM ，运维人员是可以提高集群的性能，提升服务质量，提高合规性并降低管理成本。 DKM 设计的目的是为了使得对于企业数据中心的管理变得简单和直观。（3）HDFS 高可靠在标准配置中，NameNode 是HDFS群集中的单点故障（SPOF）。 3、权限管理对系统管理员，数据库管理员及其他管理员必须授予不同级别的管理权限。
1.6K50发布于 2018-11-02
来自专栏bisal的个人杂货铺
大模型和智能运维的结合
3.收益，使用智能化运维能够更快速更高效地解决运维问题。 ● 观点2 有如下难点： 1.数据安全：企业数据的安全问题，一般企业数据是不能将数据流出到外面，因此不可用外部的大模型服务。大模型智能化运维这几个问题如何解决：1.如何对设备系统的数据收集、清洗和转换？2.如何自动化执行运维任务，故障修复，提高运维效率？3.大模型被认为一个黑盒，如何对问题处理决策进行解释？（3）数据转换：传统nlp需要进行分词，词性标注等等，而到了大模型时代，不需要太多的数据转换，只需要大模型的词表统计即可，方便后续token化。 2.如何自动化执行运维任务，故障修复，提高运维效率？ ● 观点3 1.对设备系统的数据收集、清洗和转换还是从专业监控工具走，大模型的运维智能体主要还是做数据消费，而且是对已经由专业监控工具处理过的数据做消费，结合工单数据、自动化作业执行数据和CMDB数据。 3、大模型智能化运维面临内容和问题在大模型智能化运维中，面临的主要问题包括数据收集清洗转换的质量保障，自动化执行运维任务的有效性，以及大模型的劣势规避。
1.3K00编辑于 2025-02-03

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

运维 | 运维好数据中心的四大法宝

大模型进驻运维战场：运维数据处理的智能革命

3.【kafka运维】Topic的生产和发送运维脚本(3)

运维=平台+数据

腾讯云运维干货沙龙-海量运维实践大曝光（三）

腾讯云运维干货沙龙-海量运维实践大曝光（二）

腾讯云运维干货沙龙-海量运维实践大曝光（一）

日常运维 3

Linux运维常用知识（3）

3.【kafka运维】Topic的生产和消费运维脚本

大模型在蓝鲸运维体系应用——蓝鲸运维开发智能助手

IT运维大咖带你玩转企业信息运维自动化

大模型在蓝鲸运维体系应用——蓝鲸运维开发智能助手

指标数据运维流程

运维的shell小编（3）

运维相关指标数据采集并ES入仓 - 运维笔记

徒手教你制作运维监控大屏

系统运维五大要素

深度解析大快DKM大数据运维管理平台功能

大模型和智能运维的结合

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

运维 | 运维好数据中心的四大法宝

大模型进驻运维战场：运维数据处理的智能革命

3.【kafka运维】Topic的生产和发送运维脚本(3)

运维=平台+数据

腾讯云运维干货沙龙-海量运维实践大曝光 （三）

腾讯云运维干货沙龙-海量运维实践大曝光 （二）

腾讯云运维干货沙龙-海量运维实践大曝光 （一）

日常运维 3

Linux运维常用知识（3）

3.【kafka运维】Topic的生产和消费运维脚本

大模型在蓝鲸运维体系应用——蓝鲸运维开发智能助手

IT运维大咖带你玩转企业信息运维自动化

大模型在蓝鲸运维体系应用——蓝鲸运维开发智能助手

指标数据运维流程

运维的shell小编（3）

运维相关指标数据采集并ES入仓 - 运维笔记

徒手教你制作运维监控大屏

系统运维五大要素

深度解析大快DKM大数据运维管理平台功能

大模型和智能运维的结合

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

腾讯云运维干货沙龙-海量运维实践大曝光（三）

腾讯云运维干货沙龙-海量运维实践大曝光（二）

腾讯云运维干货沙龙-海量运维实践大曝光（一）