首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏北京马哥教育

    | 数据中心的四法宝

    对于数据中心,工作的重要性不言而喻,在数据中心生命周期中管理是历时时间最长的一个阶段。 投资巨大的数据中心,为了能够尽快得到收益,就需要在运的工作上多下工夫,切勿进入“一流设备、二流设计、三流”的不良运营之中,高品 质数据中心的工作至关重要。 那么如何才能提升数据中心的水平,本文提出了数据中心工作制胜的四法宝,做好这四个方面的工作将使数据中心一直 运行于最佳状态,为数据中心创造最大的受益。 通过对数据中心而 输出的各种技术文档,将为后来人提供方便,并且可以提升数据中心整体的能力。数据中心的文档五华八门,你不知道什么时候其中的哪些文档就会派上用场。 工程文档、业务备份、在线监测、周期巡检是数据中心工作的四个重要方面,只有做好这四个方面的工作,才能让数据中心保持长期稳定运行,并能产生良好的效益,是数据中心水平高低的主要体现,拥有这四法宝,将使数据中心终身受益

    3.9K70发布于 2018-05-02
  • 来自专栏AI+运维:智能化运维的未来

    模型进驻战场:数据处理的智能革命

    模型进驻战场:数据处理的智能革命在传统工作中,数据处理一直是个让人头疼的问题——日志分析、异常检测、告警优化,各种数据纷至沓来,往往让人员不堪重负。 如今,模型技术正在悄然改变这一现状,让不再是靠经验“拍脑袋”,而是依赖数据驱动的智能决策。今天,我们就来聊聊模型技术在运数据处理中的应用,看看它到底能帮人员省多少力。 数据为何需要模型? 人员的工作将逐步从“疲于奔命”变为“智能”,让数据真正服务于业务增长。总结模型技术的引入,让数据处理迈向智能化。 无论是日志分析、异常检测还是告警优化,人员都可以借助模型,大幅提升数据处理效率,降低负担。

    60210编辑于 2025-05-25
  • 来自专栏CU技术社区

    工程师需要掌握的7武器

    工程师 —— “Operations Engineer”,字面意思可理解为管理系统、服务器的工程师。 工作对于非岗位的人来讲,一直都是神秘的,简单来说算是一种工作类别了,除去互联网软件行业的人员不说,一般的机关事业单位也有相应的岗位配置,即信息处,科技处之类维护单位IT系统的团队,大体工作内容主要包括 05 要有责任心和职责感 基本上是系统对外提供服务的最后的把关者。因此,一个系统对用户来说是不是稳定跟有很大的关系。 特别是,当系统不出现问题的时候,许多运都不重视容灾备份和数据安全,这样一旦系统出现了故障,系统的恢复就需要花很长的时间。 06 不断学习 计算机的发展真的是太快了,新的知识、新的技术层出不穷。 07 不断钻研,精益求精 应该说工作的弹性还是很大的。即使非常粗造的一个系统,也可以持续改进、优化系统,使系统越来越高效的运行。

    77620发布于 2019-10-25
  • 来自专栏运维经验分享

    CentOS 7 优化 原

    CentOS 7 优化 一般的,我们安装CentOS mini和其他相应服务后,就能正常工作了。但工作一段时间后,服务器会出现不稳定、被入侵、甚至在突然的高并发时直接瘫痪状况。 所以,在这里提供一些优化的建议。 1.关闭不需要的服务 众所周知,服务越少,系统占用的资源就会越少, 所以应当关闭不需要的服务。 "$tty" = "$X_TTY" ] && continue initctl start tty TTY=$tty done end script 1 2 3 4 5 6 7 8 7.调整 Linux 的最大文件打开数 要调整一下 Linux 的最大文件打开数,否则运行 Squid 诅服务的机器在高负载时执行性能将会很差;另外,在 Linux 下部署应用时,有时候会遇上 “ ESTABLISHED;正常数据传输状态。 FIN_WAT1:应用说它已经完成。 FIN_WAT2:另一边己同意释放。 ITMED_WAIT:等待所有分组死掉。 CLOSING;两边尝试同时关闭。

    2.8K20发布于 2019-03-11
  • 来自专栏祝威廉

    =平台+数据

    会比开发更加重要 的发展日新月异,曾几何时,仅仅是被认知为跑机房,装系统,设计网络,给开发擦屁股。 但是现在运变得极度重要,职责也更加细化,譬如稍大点的公司就将划分为基础,网络,DBA, 应用,架构师。 发展新方向 之前我写过一篇文章,谈及如何用大数据思维做,当然这篇文章有他自己的局限性,只是谈及了监控,灌输一种 data based 的理念。 一切服务都是为了帮助数据进行流转和变换,服务的状态也都反应在数据流上,这种瞬态和终态的量是非常的,所以我们需要借助大数据的思维去做处理。 到这里就可以参考大数据思维做灌输的概念了。 所以未来可以完全依托一个固定的分布式操作系统,在其上开发各种工具,利用大数据相关的理念和工具,监控,追踪,分析服务的状态,解决现有的工具碎片化,难以复制,难于贡献生态的问题。

    4.2K50发布于 2018-08-27
  • 来自专栏织云平台团队的专栏

    腾讯云干货沙龙-海量实践曝光 (三)

    作者丨周小军,腾讯SNG资深工程师,负责社交产品分布式存储的及团队管理工作。对互联网网站架构、数据中心、云计算及自动化等领域有深入研究和理解。 12月16日,首期沙龙“海量实践曝光”在腾讯大厦圆满举行。 一、活动背景 [图片] 有三座大山:活动、大变更、大故障。这几个场景是最消耗人力的。特别是活动,非常考验弹性能力,对自动化挑战很大。 我今天所分享的主题就是深入百亿次红包活动的背后,解析腾讯的方法体系,了解织云平台如何帮助实现活动高效,如何减少运人海战术。 相关文章 腾讯云干货沙龙-海量实践曝光 (一) 腾讯云干货沙龙-海量实践曝光 (二) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3

    6.2K10发布于 2017-12-17
  • 来自专栏织云平台团队的专栏

    腾讯云干货沙龙-海量实践曝光 (二)

    作者丨魏旸:腾讯高级工程师,具有15年经验的专家。负责QQ空间、微云、QQ空间相册等的工作。 12月16日,首期沙龙“海量实践曝光”在腾讯大厦圆满举行。 沙龙出品人腾讯技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深专家周小军出席沙龙,并带来精彩的技术分享。 同时深圳的PC或者移动端用户更新了空间,数据需要同步到其他地域的后端存储上,空间有一套专用的同步中心架构来保证数据同步。 简单介绍一下同步中心的架构:单写多度的业务讲数据接入同步中心后,同步中心通过多种技术手段保证数据同步到多地的读SET。 [图片] [图片] 相关文章 腾讯云干货沙龙-海量实践曝光 (一) 腾讯云干货沙龙-海量实践曝光 (三) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3

    9.4K10发布于 2017-12-17
  • 来自专栏织云平台团队的专栏

    腾讯云干货沙龙-海量实践曝光 (一)

    作者丨郭智文:腾讯高级工程师,手机QQ负责人。 12月16日,首期沙龙“海量实践曝光”在腾讯大厦圆满举行。 沙龙出品人腾讯技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深专家周小军出席沙龙,并带来精彩的技术分享。 总结 相关文章 腾讯云干货沙龙-海量实践曝光 (二) 腾讯云干货沙龙-海量实践曝光 (三) 沙龙PPT下载地址: https://share.weiyun.com /5c406a57164ed4cf7e248160aebf74c3

    6K30发布于 2017-12-17
  • 来自专栏大模型

    模型在蓝鲸体系应用——蓝鲸开发智能助手

    2、模型对开发带来的挑战和机遇最近几年,模型的爆发式发展为开发和行业带来新的变革,2021 年 7 月 1 日,由 GitHub 和 OpenAI 共同开发的人工智能编码助手——Copilot 而且,通义灵码的工作节奏比 996 还要极致:7x24 小时随叫随到......看起来,模型的应用似乎要终结开发框架、低代码这类脚手架开发工具。难道,不再需要开发转型了? 模型在运开发上的应用从模型的原理上看,模型经过海量的数据训练,在开发领域,很多大模型学习了几十亿行代码,庞大的数据基础使得这些模型在代码的规范性、准确性方面展现出了卓越的效果。 技术架构上,通过 RAG + Embedding 技术,可以海量的知识(截至 2023 年 12 月,嘉为知识库存量文档 394035 篇,月均消费 7 万+次)向量化存储,作为模型的外挂知识库, 的功能;开发平台将数据库表结构和用户输入文本进行格式化整合后,经过 Prompt 优化后发送到模型;模型返回 SQL 语句,用户复制或插入到平台中。

    1.3K01编辑于 2024-05-27
  • 来自专栏千帆企业应用连接器

    IT咖带你玩转企业信息自动化

    但是小到企业设备、系统的到企业的多个信息系统的规划、选型、建立整体的业务数据中台,企业的IT信息化部门,是“IT里最懂本企业的业务,又是懂业务的人里IT技术最强的”存在,也在越来越多的企业数字化转型中担任着重要的选型 非典型IT负责人王焱焱是一位非典型IT负责人,热爱电脑的他从中学就开始折腾3C设备,并且自主参加了IT技术的培训。 零代码玩转IT自动化王焱焱爱琢磨,爱学习,爱分享。集团的IT工作中,有许多重复琐碎却价值低的工作,他一直在思考,在自己的工作中,如何去不断优化。 第一次接触腾讯云HiFlow场景连接器里,是接触到了,可以零代码实现企业微信群机器人的能力,IT自动化终极攻略今晚等你你来听!零代码打造灵活值班自动化?IT知识库更新及时提醒? 企业软硬件自动告警?

    64030编辑于 2022-09-28
  • 模型在蓝鲸体系应用——蓝鲸开发智能助手

    2、模型对开发带来的挑战和机遇最近几年,模型的爆发式发展为开发和行业带来新的变革,2021 年 7 月 1 日,由 GitHub 和 OpenAI 共同开发的人工智能编码助手——Copilot 而且,通义灵码的工作节奏比996还要极致:7x24小时随叫随到…看起来,模型的应用似乎要终结开发框架、低代码这类脚手架开发工具。难道,不再需要开发转型了?甚至“零”在AI的帮助下提前实现了? 模型在运开发上的应用从模型的原理上看,模型经过海量的数据训练,在开发领域,很多大模型学习了几十亿行代码,庞大的数据基础使得这些模型在代码的规范性、准确性方面展现出了卓越的效果。 技术架构上,通过 RAG + Embedding 技术,可以海量的知识(截至2023年12月,嘉为知识库存量文档394035篇,月均消费7万+次)向量化存储,作为模型的外挂知识库,利用模型强大的总结能力 的功能;2.开发平台将数据库表结构和用户输入文本进行格式化整合后,经过 Prompt 优化后发送到模型;3.模型返回SQL语句,用户复制或插入到平台中。

    1.2K10编辑于 2024-11-13
  • 来自专栏博文视点Broadview

    人员7*24值班拯救指南

    人员经常需要在周末出去游玩的时候也带着电脑,因为很多情况下人员需要随时待命。笔者依稀记得2014年左右,我们10多个小伙伴团建时背着5斤重的电脑爬青城山的壮丽场面。 (1)业务线较多,不同的问题得由不同的人员跟进。 (2)开发人员、客服、测试人员都会给人员反馈问题,流程混乱,人员长时间处于被动接受的状态。 ,这种时候值班人员既要承担应急工作,又要执行各种协调任务,效率大打折扣。 01 让开发人员参与其中 不少技术团队的值班体系中只包含人员,极少有开发人员参与,这也导致当故障发生时,人员应急对接开发人员的过程变得不顺畅,再加上开发人员被临时拉进来的时候并没有值班待命状态, (2)业务开发值班人员需要满足7×24小时的待命计划,并且主备两个角色。 (3)正常工作中,参与值班的开发人员的工作需要包含但不仅限于以下内容。

    1.6K20编辑于 2023-08-10
  • 来自专栏腾讯云大数据

    Flink 实践教程-进阶(7):基础

    数据类型映射 数据类型映射错误也是一个比较常见的错误。 在正式运行之前请检查:  类名是否有拼写错误 确定是否将相关的业务代码依赖打进 JAR 包中 基础 作业监控 流计算 Oceanus 提供强大的作业监控能力,我们可以通过【监控】项查看作业的各项指标 云监控监控指标主要包括七维度,分别为: 作业运行信息类 JobManager 运行信息类 TaskManager 运行信息类 JobManager GC 类 TaskManager GC 类 作业 Checkpoint 之后介绍了下作业启动之后的一些基础手段,包括实时监控和告警通知,方便用户及时了解作业的具体运行情况。最后介绍了在作业失败之后通过日志关键字定位问题的方法,具体可以查看 日志诊断指南[6]。 长按二码 关注我们

    3.1K11编辑于 2022-01-21
  • 来自专栏DBA随笔

    MongoDB与开发(7)---MongoDB监控

    // MongoDB与开发(7)---MongoDB监控 // MongoDB中自带两个监控的工具,分别是mongostat和mongotop,今天我们看看这两个工具的使用方法。 mongostat mongostat工具提供了mongod和mongos的运行状态和数据,可以从mongostat工具的执行结果中获取如下信息: [root@VM-0-14-centos ~]# mongostat collections:当前数据库中集合的数量 view:当前数据库中视图的数量 objects:当前数据库中所有文档的数量 avgObjSize:数据库中文档的平均大小 dataSize:当前数据库的数据大小 ,单位是byte storageSize:当前数据库占用硬盘空间的大小,单位是byte numExtents:当前数据库中所有集合Extents扩展的数量统计 indexes:当前数据库中的索引数量 indexSize members:列出副本集中每个成员的信息数据

    1.4K10发布于 2020-11-26
  • 来自专栏个人总结系列

    指标数据流程

    现状 针对目前大数据异常响应效率低,解决处理定位难,压力集中在某几个人等不合理的现状。 针对技术组件方向,建立大数据技术保障组,异常谁发现谁报备到保障组并@组件负责人,组件负责人根据实际情况,业务重要程度,是否发起团队能力协助处理来主要负责处理。 二.

    1.3K00发布于 2021-08-14
  • 来自专栏散尽浮华

    相关指标数据采集并ES入仓 - 笔记

    收集到的应用指标数据最好要进行ES入仓,入到Kafka里面,并通过Kibana可视化展示。 需要进行采集的应用进程相关指标如下: ? 指标值 indexValue CHAR 是 支持批量 指标类别 indexType CHAR 是 安全 测试 运行 应用 环境 指标描述 indexDesc VARCHAR 是 指标说明,指标采集数据源 u7a7a\u95f4\u4f7f\u7528\u7387'}, {u'appname': u'bobo', u'@timestamp': u'1561030595', u'hostname': u'kevin_test \u5e8f\u7a7a\u95f4\u4f7f\u7528\u7387'}, {u'appname': u'bobo', u'@timestamp': u'1561030595', u'hostname \u4ee3\u7a7a\u95f4'}, {u'appname': u'bobo', u'@timestamp': u'1561030595', u'hostname': u'kevin_test'

    1.7K31发布于 2019-07-08
  • 来自专栏james大数据架构

    徒手教你制作监控

    在公司开发人员资源紧张的情况下,想要快速搭建起一套屏可以使用Grafana。   Grafana 是一个开源的监控数据分析和可视化套件。 综合屏展示   以上内容都是分模块的,现在想把服务器、业务访问流量、容器状态放在一个屏内显示,每一块都来各自的数据源。 关键在于一块屏要展示哪些关键信息,摈弃掉无关紧要的内容,下面是其中一个屏,具体制作方式与上面一样,其中图形大小与布局需要根据投影到屏上的分辨率有关,需要现场调试。 ? 关于屏展示的技巧 Grafana提供一个屏展示轮播功能,几个看板之间自动切换,具体就是Playlists。 ? 给屏一个名字,和切换间隔,然后将需要轮播的看板加入。 ? Grafana还可对接很多数据源,需要自行去探索,有能力的可以进行二次开发,打造自己的监控屏。

    4K41发布于 2020-06-19
  • 来自专栏运维前线

    系统要素

    https://blog.csdn.net/wh211212/article/details/53199058 系统要素 如今的互联网是一个巨大的变幻莫测的世界,每个站点、每个应用程序 要想在21世纪取得 24x7维和系统成功的话,关键是要能够理解并合理地关注这五要素。 监控包括:常规的 CPU、RAM、以及磁盘输入/输出监控,还包括对许多与网络服务器、应用程序和代码、数据库等相 关的特定服务问题的监控,重点是对能够提高和/或降低大型系统性能的关键变量进行监控 这种做法也能够帮助程序开发员和团队成员强行地把安全观牢 记在心。 要想在21世纪取得成功和系 统成功的话,关键是要能够理解并合理地关注这五要素。

    4K20发布于 2019-05-26
  • 来自专栏hadoop学习

    深度解析快DKM大数据管理平台功能

    深度解析快DKM大数据管理平台功能 之前几周的时间一直是在围绕DKhadoop的运行环境搭建写分享,有一些朋友留言索要了dkhadoop安装包,不知道有没有去下载安装一探究竟。 关于DKHadoop下载安装基本已经讲清楚了,这几天有点空闲把快DKM大数据管理平台的内容整理了一些,作为DKHadoop相配套的管理平台,是有必要对DKM有所了解的。 通过DKM ,人员是可以提高集群的性能,提升服务质量,提高合规性并降低管理成本。 DKM 设计的目的是为了使得对于企业数据中心的管理变得简单和直观。 2.提供实时的集群概况,例如节点,服务的运行状况; 3.提供了集中的中央控制台对集群的配置进行更改; 4.包含全面的报告和诊断工具,帮助优化性能和利用率; 基本功能:DKM的基本功能主要可以分为四模块 3、权限管理 对系统管理员,数据库管理员及其他管理员必须授予不同级别的管理权限。

    1.6K50发布于 2018-11-02
  • 来自专栏bisal的个人杂货铺

    模型和智能的结合

    模型赋能的智能化为企业提供了一种全新解决难题的路径。它能够通过类似人一样强大的文字阅读和数据处理能力,从海量数据中快速提取有用信息,实现问题的精准定位和快速解决。 4.团队的日志数据,解决方案数据等储备不足,而这也是模型做训练时缺少的样本。 团队需要构建自身的领域知识体系为模型作平台支撑,通过建立框架为模型进行数据输入,比如,日志、指标以及相关事件信息等。 7.成本问题: 智能化的成本较高,对于中小企业来说可能是一个负担。因此,建议企业根据自身实际情况选择合适的智能化方案,并逐步推进实施。 3、模型智能化维面临内容和问题 在模型智能化中,面临的主要问题包括数据收集清洗转换的质量保障,自动化执行运任务的有效性,以及模型的劣势规避。

    1.3K00编辑于 2025-02-03
领券