首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏运维笔记

    门店ITCMDB实战:用这套最小数据模型把100家门店的资产和配置管起来

    背景:自动化跑得越快,配置漂移越难追管理100+门店体系里,监控、告警、工单、自动化核查这些环节可能都已经跑起来了。 Zabbix主机列表是一份数据,Ansible的inventory文件是一份,同事的Excel又是一份,历史工单备注里还散着一些。四个来源各有各的版本,每次改了设备也不一定同步。 这篇文章给出一套门店CMDB最小数据模型的落地方案:从哪些字段必须有、门店/设备/链路三层怎么建、怎么和监控/自动化打通联动,到防止CMDB数据腐化的运营动作。 ✅责任人on_site_contactstring✅现场联系人statusenum✅active suspended decommissionedmgmt_networkstring✅管理网段设备 5-8次基本为0小结门店CMDB的核心不是"把设备信息记下来",而是让所有系统共用同一份设备事实。

    8510编辑于 2026-05-07
  • 来自专栏终有链响

    fiscoBcos工具机搭链

    机搭链 使用generator搭建机部署的Fisco链 以下是我们要做的实践 我们将从机两节点部署开始,机构A和机构B,为机构A节点1做落盘加密 为机构A新增节点3并加入群组1 新增机构C节点4 输入命令: cp -r generator/ generator-A 这里我复制了一个D作为备份,为以后需要做更改做准备 6链证书初始化 一条链只能有一条唯一的链证书ca.crt,我们选择在generator /generator-A/nodeA目录下执行以下命令: tail -f node_10.206.0.13_30360/log/log_202412031* | grep +++ 至此双机单群组机构的区块链网络已经搭建成功

    48710编辑于 2025-01-15
  • 来自专栏北京马哥教育

    如何实现站点监控?

    来源:python技术 ID:python技术 在小型公司里如果产品线单一的话,比如就一个app, 一般1~2个就够用了,如果产品过于庞大,就需要多个人员,但对于多产品线的公司来说, 人员就要必须分多个人负责,因为超过200个站点让1个人维护,那工作量是巨大的,就单单给开发的沟通时间,估计就要占用一整天时间了,目前我所在的公司站点非常,为管理方便,之前我们这里是实行过一段叫站长制的方式 我还没给出发报警邮件的函数代码,不但没贴而且不妨告诉大家我是故意的,之所以没直接给呢, 第一:是因为现在报警方式太多了,我建议大家在这个脚本基础上进行修改实现自己想要的报警方式,第二:就当是留个作业吧,毕竟动手才能提高编程水平

    1.2K20发布于 2018-08-17
  • 来自专栏NebulaGraph 技术文章

    如何集群数据库?58 同城 NebulaGraph Database 实践

    资源申请和集群管理方式 为了更好的管理和维护,图数据库在运部门集中管理。用户按需在工单平台中提交申请即可,工单中填写详细的资源需求数据和性能需求指标,由同学统一审核交付集群资源。 为了高效管理和规模化的集群,需要提前规划和制定规范。 61000 meta 端口;51000 ws_http_port;41000 ws_h2_port 62000 storage 端口;52000 ws_http_port;42000 ws_h2_port 规范 端口 路径打包生成 rpm,作为标准安装包 图片 服务请求直接通过 DNS 和网关服务到 Graph,方便计算和存储服务直接交互,由于是通过 DNS 访问,不对外暴露 Meta 节点信息,可以更灵活的 ,较少服务绑定 Meta 节点 ip 带来的代价。

    4.9K20编辑于 2023-02-15
  • 来自专栏zhangdd.com

    必看,还要懂这么

    我们这篇文章不是说除了懂Linux,还要懂Windows,而是涉及的其他方方面面。 环境部署 一开始这个世界是开发的,然后才是的。 有些时候,开发环境也是需要来部署的。 排错和调优 事情从来都没有一帆风顺的。 上线没多久,服务就502了,还不被老板骂死。尽管你有一肚子的委屈,我只是个,代码不是我写的,为什么要我来背这锅?! 相关技术: F5, Nginx, LVS, HA-proxy, MHA, Zookeeper, 各种其他分布式集群方案, … 监控告警 工程师的第一次解放运动。 当有故障发生的时候,通过短信、微信、钉钉、邮件等等通知对应的工程师来处理,甚至是自动切换或摘除故障节点,然后我们离线对故障节点进行问题排查。 现在国内的阿里云和腾讯云也发展得如日中天,他们几乎提供了所需要的一切,甚至可以让一个公司不再需要的岗位。你需要服务器,只需要几秒钟,就可以创建一台。

    81730发布于 2018-08-01
  • 来自专栏互联网运维杂谈

    初探精益体系|

    有一种努力一直放在心中,想更系统的表现,内心的这份冲动源于两点: 1.在互联网化业务的今天,的作用可以被更重视。 2.需要更体系化,更理论化,更实践化的阐述。 在之前,我用过价值化来概括过,我也多次在文章中或公开演讲中提到应该关注“面向用户的价值“,但我依然觉得还是不够精炼。 直到后来想到了“精益“这个词,把它和做了一次融合,只因精益思想的背后,很多观点都和我们很契合。接下来看看我在《全球运大会|上海站》上分享的主题——面向高性能IT的精益体系。 基于TPS屋,我做了一次转换,把他放到了领域中,提炼出精益屋。 ? 非常希望我们能秉承着精益的理念对对待,只有这样才能把做好,才能更好的驱动IT产生更多的价值。 希望未来能出现更多的精益人,在组织内不断的驱动IT组织能力提升和改进。

    2.1K10发布于 2019-11-18
  • 来自专栏云原生应用工坊

    集群(二):应用渐进发布

    关键在于运用自动化工具和最佳实践,以实现高效、可靠的流程。 目标细节 IaC管理云资源: 使用基础设施即代码(IaC)方法来初始化云资源。 自动化工具和流程的应用不仅减少了人为错误的风险,还提高了效率和系统的可靠性。 d72ba38f7a3a76b71eb50f00fe46a94497e6ecaa" ingress: className: "apisix" canary: enabled: true 通过上述步骤,我们能够实现在集群环境中的应用渐进式发布

    57010编辑于 2023-12-29
  • 来自专栏用户6465593的专栏

    连锁门店如何借助设备管理系统,提高报修及效率?

    随着业务的发展,餐饮、商超、酒店、便利店、百货公司的零售门店越来越多、地点分布也越来越分散。随着门店的不断扩张,企业在设备管理上也逐渐变得困难,尤其是设备维修的闭环式管理。 举个例子,门店设备在发生故障后如何及时上报,上报后维修人员如何快速定位故障现场,联系报修人。 加强连锁门店企业内部设备数字化管理水平,成为连锁企业能否低成本发展的因素之一。那么如何帮助连锁门店打造更加高效门店设备报修服务体系,保障连锁门店高效运转? 图片 易点易动设备管理系统为连锁门店提供设备管理解决方案: 设备全生命周期管理 通过一物一码管理,为每个设备都提供一个唯一的二码,从设备的申购、采购、验收、入库到报废,实现了设备的全生命周期管理。 统一平台报事报修,打通门店服务环节 易点易动系统让用户告别纸质化填写工单,支持扫码报修、APP报修及处理、PC端后台管理的多端智能交互使用,各门店无论从哪个渠道报修,都能获得及时响应,快速得到总部的技术支持

    89220编辑于 2023-03-23
  • 来自专栏AI+运维:智能化运维的未来

    不怕事,就怕没数据——用大数据喂饱你的策略

    不怕事,就怕没数据——用大数据喂饱你的策略”咱干的都知道,一个系统出问题,往往不是技术没到位,而是问题没及时发现,或者发现了却没找到根因。 一、为什么离不开大数据以前的更多是“救火队”:监控报警 → 接单 → SSH 上服务器排查一顿猛查,找到原因修好 → 继续等下一次报警这套流程的缺点很明显:反应慢:报警来了才动手。 而大数据的价值,就是把海量数据“榨干”,让我们:提前预警快速定位自动化决策一句话,大数据让从“救火”变成“防火”。二、数据从哪来? 四、优化的几种大数据玩法真实场景可不止检测 CPU,这里我给你总结几个高价值玩法:1. 如果说传统靠经验,那数据驱动就是“经验 + 科学”的结合,既有老道的判断,也有算法的精准。所以我一直跟团队说:别等报警响了才翻日志,先用大数据把明天的问题今天找出来。

    28800编辑于 2025-08-12
  • 来自专栏日志服务CLS

    10倍流量突增,智能门店行业引领者—「非码」如何灵活

    非码是行业领先的智能门店提供商,服务于行业内众多一线品牌,对服务稳定性、问题处理及时性都有极高的要求,日志是环节中重要的一环。 【用户说】 刘立湘 —— 非码科技总监 CLS的低成本以及弹性扩缩容很好的满足了我们日志需求,同时也解放了更多运人力聚焦在业务本身。 业务背景 非码科技作为一家服务众多品牌的SaaS化解决方案提供商,致力于将智能门店带入每个消费者、每个门店、每个品牌,构建智能商业世界。 这就对非码方的维和运营能力都提出了极高的要求。 前期非码使用ELK作为/运营平台,遇到的主要挑战如下: 1. 通过高效便捷的数据接入方案,一键部署,数据快速导入,使非码的成本趋近零。

    1K10编辑于 2022-01-17
  • 来自专栏devops_k8s

    的感悟(做需要考虑事,组织结构,学习地图....)

    需要考虑的事 简介 /* 是在于一个量 最少的人,最多的事 并且保证业务 比如说google的一个数据中心,只有几个人在维护 不能直接的创造价值,而是可以变相的节约成本 5.文档要写,比如资产文档,那些机器的配置,还有密码表,服务连接文档,部署文档,维护文档都要写,文档的作用一个是自己用,另一个是等你离职或者新员工加入,他们可以快速来维护。 研发 研发负责通用的平台设计和研发工作,如:资产管理、监控系统、平台、数据权限管理系统等。提供各种API供或研发人员使用,封装更高层的自动化维系统。详细的工作职责如下所述。 (1)平台 记录和管理服务及其关联关系,协助人员自动化、流程化地完成日常操作,包括机器管理、重启、改名、初始化、域名管理、流量切换和故障预案实施等。 ,处理值班问题,确保系统服务稳定性; 负责自动化/标准化方案设计,自动化工具及平台研发,提升效率; 负责生产、测试、灰度套环境的部署和维护,配合研发、测试团队进行应用部署;

    8.1K1011发布于 2020-12-23
  • 来自专栏云原生应用工坊

    集群(番外篇):SSL证书的管理

    概述 在 Kubernetes 集群环境中,采用泛域名证书管理是一种有效策略。通过申请一个泛域名证书,你能够为同一根域名下的多个子域名提供安全的通信。

    1.1K30编辑于 2024-01-07
  • 来自专栏灵光独耀

    CAM访问管理,子账户轻松解决地域租户场景

    亦适用于供应商管理,如:同一个腾讯云账号但是有两个供应商,其中一个供应商需要有xx服务器的管理权(不想让这个供应商看到和进入和操作其他服务器)另外一个供应商同理就是只有广州服务器的管理权以此类推。

    39610编辑于 2025-09-07
  • 来自专栏kafka专栏

    【kafka】Leader重新选举脚本

    1 指定Topic指定分区用重新PREFERRED:优先副本策略 进行Leader重选举

    4K40编辑于 2021-12-31
  • 来自专栏kafka专栏

    【kafka】ConfigCommand脚本

    默认配置 附件 More 日常 、问题排查 怎么能够少了滴滴开源的 滴滴开源LogiKM一站式Kafka监控与管控平台 ConfigCommand Config相关操作; 动态配置可以覆盖默认的静态配置

    3.2K10编辑于 2022-04-13
  • 来自专栏互联网运维杂谈

    精益之八种浪费模式|

    我把制造业的八种浪费模式(左边)映射到我们的八种浪费模式(右边),这种浪费模式的整理是一个引子,目的就是让大家观察组织中存在的浪费行为,这种浪费行为的梳理可以更大面积的扩大,比如说到IT组织上。 浪费之四:流程是互联网的大敌,特别是上层业务。流程思维/流程设置/流程自动化能力不足,都是一种浪费的表现。 ? 浪费之七:缺陷带来的是后续的人肉,苦逼,救火。过多的线上缺陷必然让疲于奔命。 浪费之八:很多IT企业存在人力浪费,一线人员的创造力/执行力/经验都没有得到很好的发挥;还有一种是招聘了过多的人来做,俗称人肉组织方向感不足,导致合力不够。 ? 在运组织中,放纵一些浪费的行为存在,其实就是价值低下的表现。拒绝浪费,是一种精益的表现!

    93010发布于 2019-11-19
  • 来自专栏北京马哥教育

    故事】小白黑化记

    来源:人那些事儿 ID:jzjytd2016 【01】换工作 2017年8月份的某一个晴朗慵懒的下午,我在望京中环南路7号西家大院E楼5层最角落且紧靠大落地窗的工位上掐指一算,我在研究院竟然已经工作 顶着小伙伴和家人都觉得你脑子进水的诧异目光,我开始了我的换工作大业,从实习开始就在研究院工作,突然开始可以选择了竟然有些茫然,种种纠结波折暂且不表,总之,在2017年12月18号,我走进了东四157号,正式成为了银河信息化集中交易团队的一份子 每每想到这些,我除了自责、懊恼、自我怀疑之外,也深深体会到了团队成员的团结和大家释放出来的善意,对于团队来讲,每天来自业务部门及客户的压力非常大,小心翼翼,如履薄冰,全部精力用来对抗外部还不够,对于团队内部制造麻烦消耗精力的人的态度 这次经历也让我对工作有了新的认识和更多的思考,在这里和大家分享一下: 操作层面 1. 线上操作无小事”,坚持 “双人复核”,坚持“按照流程操作” 端正心态,受过去经历和个人性格的影响,我是一个有一点个人英雄主义倾向的人,来到新的团队,更是急于证明自己,心态出了问题自然会导致路线跑偏,生产系统线上是一个严谨度要求非常高的工作

    2.9K30发布于 2018-06-20
  • 来自专栏用户3059880的专栏

    多数据中心工具解决方案

    一般的大型数据中心往往是由很多功能不一的分中心系统组成,其工作需要具备方方面面的知识,包括硬件、网络、服务器、存储等等,需要一体化联动地去做好运工作。 特别是当多个数据中心使用不同的监控工具,难度会更大。多数据中心监控工具的场景一般是大型央企集协和和服务商的环境中比较多。 针对央企集团和和服务商,TOC提供了多数据中心监控工具的的整合方案。 多客户及项目管理混乱 人员管理调度效率低下 人员服务质量难以量化 不同客户避免数据互相泄露 不同客户账户权限管理 人工管理成本、工具不统一造成的维护成本 TOC在服务商运营模式下的价值体现 : 减少人员成本,提高效率 提高客户满意度,响应时间管理 保障工具数据安全隔离 提供互助托管服务 帮助服务商拓展业务范围

    1.2K20发布于 2019-12-24
  • 来自专栏kali blog

    自媒体福利 一键同步平台

    今天表哥为大家推荐一款支持多个平台同步发送的浏览器插件Wechatsync 关于 Wechatsync一键同步文章到多个内容平台,支持今日头条、WordPress、知乎、简书、掘金、CSDN、typecho各大平台,一次发布,平台同步发布

    44910编辑于 2025-07-28
  • 来自专栏devops_k8s

    管理与自动化

    1 工作有哪些? 7.2 管理文章开头说管理主要目标是标准化/规范化,自动化,可视化/web化,从切身体验来看管理的目标也是随着自动化阶段的不同而变化的。 理由:(1)自动化的价值在于,将从繁琐的、例行、容易发生人为事故的工作中脱离出来,做更有价值的业务维和服务。所以,从这个角度来看,自动化既不是起点,也不是终点。 自动化不是万能的,我们需要看清楚它的位置。(2)的本质到底是服务,是服务于业务,因为是用技术解决业务问题,的价值要依托于业务才能体现。 不是因为技术高深,或者管理了几万台服务器而很牛逼,也不是能玩转很多开源工具而很牛逼,这都不是的关键。对于来说,服务第一,技术第二。

    2.9K60编辑于 2023-07-21
领券