10月20日,嘉为科技携手腾讯蓝鲸智云联合主办的智慧生长·研运未来暨2021年研运治理实践大会于北京隆重召开。 ,详解企业研运治理的标准、规划蓝图、落地实践,以及未来智能化发展趋势。 DevOps首席咨询师汪珺悉数出席,发表了专业且见解独到的主题演讲,与各行业嘉宾客户共同探讨智慧研运新未来。 现场精彩回顾 视频内容 视频内容 研运未来 金秋十月,共聚北京。线上线下,齐论研运。 智慧生长·研运未来暨2021年研运治理实践大会让我们相聚、畅谈、分享、碰撞、展望,也让经验与智慧交融互鉴迸发能量。未来,我们必将再会。 研运至简,无限可为!嘉为蓝鲸,始终与您同行!
容器还可以进行版本管理、复制、分享、修改,就像管理普通的代码一样 二、docker带来的好处(解决了什么问题) (1)职责的逻辑分离 使用docker,开发人员只需要关心容器中运行的应用程序,而运维人员只需要关心如何管理容器 Docker设计的目的就是加强开发人员写代码的开发环境与应用程序要部署的生产环境的一致性,从而降低那种“开发时一切正常,肯定是运维的问题”的风险。 ) k8s 的优势 自动化容器的部署 和 扩缩容 相同服务容器有组的概念,可以提供服务发现和负载均衡 可自我修复:当某一个node节点关机或挂掉后,node节点上的服务会自动转移到另一个node节点上 滚动更新: 更新服务不中断,一次更新一个pod,而不是同时删除整个服务 集中化配置管理和秘钥管理 任务批处理 扩展性好: 支持模块化、插件化、可挂载、可组合 k8s缺点 学习成本高 四 k8s需要安装的模块和组件 环境的搭建、docker-compose环境的搭建、K8S集群的搭建、GitLab代码仓库的搭建、Jenkins自动化部署环境的搭建、Harbor私有仓库的搭 ?
上一篇文章《DevOps|产研运协作工具链上的皇冠-项目管理工具》主要讲了项目管理工具对软件研发的重要性,本篇文章主要想讲清楚我们需要什么样的项目管理工具,项目管理工具必须具备的功能有哪些,以及如何选择最适合自己的那一款 因为这是产研项目开展过程中必不可少的活动,也是产研项目管理工具所必须要满足的。如果这些功能都没有,那么就要考虑这样的产研项目管理工具功能的完备性。 上的代码发布上线后,这个工作待办的状态自动从「testing」变成「released」同时工作待办对应的用户故事进度变成 50%,如果另外一个工作待办也上线了,那么用户故事的进度就是100%数据驱动决策正是因为产研运整个流程很长 项目管理百花齐放做到上面的功能就是一款不错的产研项目管理工具了么?不。具有上面的功能只能说刚摸到产研项目管理工具的门槛,想要成为「不错」的工具还差得很远。 对于产研运的小伙伴来说,项目管理工具是每天都要打交道的工具,其工具的用户体验和是否高效,影响着每位小伙伴的工作。我们要慎重选择。同时也期望公司的各位专家们能从自己专业的角度出发给出专业的意见和建议。
参与了大规模公共组件推广运营、社交平台的异地容灾分布、自动化运维系统建设等项目。 腾讯工程师小明就是这种基础服务的运维负责人,在推动织云路由作为统一寻址服务之前,调用方各显神通,有IP直连访问的,有DNS解析访问的,也有通过自己的寻址服务访问的。 ,不能较好的做到能者多劳,物尽其用; 单机故障会导致服务可用性受影响,需要运维人员半夜进行紧急变更; 业务压测,灰度时需要引流,限流; 业务需要过载保护,防雪崩。 这对于服务的故障自愈和运维效率有极其重要的作用:对于设备偶发性的宕机,运维人员可以制定统一的策略:首先进行重启恢复,如果重启无法恢复的故障设备,在判断宕机不会带来高负载的情况下,在特定时间批量处理故障设备 ,无需运维人员实时响应。
解析游戏研运核心瓶颈 游戏行业面临存量竞争加剧、研发复杂度攀升、运维成本高企三重挑战。 超级节点通过轻量虚拟机管理POD,支持秒级拉起,对比标准集群(需管理节点、按CVM计费),显著降低运维成本。 鸣潮采用“OpenKruiseGame开源项目(Pod原地升级、定向运维)+ Agones(多语言SDK、自动扩缩容)”组合,实现全球多区域(上海、香港、新加坡等)容器集群部署,支撑十万核后台系统二人运维 某射击游戏:英特尔编译器ICX配合LTO/PGO优化,引擎性能提升11%(基于S8第五代至强服务器)。 开心消消乐:第五代至强S8实例助力自研打关模型推理吞吐性能提升3倍+。 客户实践案例实证 鸣潮:容器化支撑开放大世界研运 鸣潮采用“TKE Serverless容器+OpenKruiseGame+Agones”架构,实现全球多区域集群部署(上海、香港、新加坡等),通过“目录服
什么是k8s? k8s是kubernetes的简称,即字母“k”到最后一位相隔8位字母。名字来源于希腊语,意思是“舵手”或“领航员”。 设置远程登录root账户 vim /etc/ssh/sshd_config 增加一行 PermitRootLogin yes 重启服务 service ssh restart 关闭交换空间(k8s 192.168.17.129:6443 --token abcdef.0123456789abcdef \ --discovery-token-ca-cert-hash sha256:6a051b8d0b670f357fe0d8e6a282b062b6f090d1b90968d6c3f3cea8dd33d104
云平台的研发和运维人员可以通过软件源管理系统快速搭建和维护 YUM、APT 等软件源,以便满足研发和运维人员在环境搭建、开发、构建、测试、运行等环节的组件和工具依赖需求,提升整体研发和运维效能。 用户可以通过周期同步的方式建立CentOS、Ubuntu等Linux发行版对应的本地源,也可以通过本地上传的方式建立自研软件制品的本地源。 历史记录 用于运维人员查看指定软件源的同步操作事件,便于判断软件源的整体工作状态。 操作记录 用于运维人员或者审计人员来查看指定软件源的操作记录(新建、修改和删除)。 这也是我们运维专题的最后一期了,小编这里将系列专题做个汇总,方便大家系统的回顾云运维,如:统一配置信息管理的CMDB、监控告警自动化的云哨系统、混沌工程故障演练平台等等: 第一期 运维专题第一期:数据中枢 第二期 运维专题第二期:警戒哨兵 第三期 运维专题第三期:诊断专家 第四期 运维平台第四期:数据掘金者 第五期 运维平台第五期:业务永续 第六期 运维平台第六期:混沌工程,助力系统稳如磐石 第七期
产研运协同主要工作流程下图是一个迭代过程中产研运协同时涉及的主要工作流程图片绿色的会议为全员参与的会议粉色为专业职能团队内部的会议通常来说PO(Product Owner)几乎每天都会梳理用户故事产研运协同主要工作会议下表详细列出了在一个迭代中涉及到的主要的会议 图片这里有几点要重点说明运维和运营小伙伴可以按需参加。通常产品和运营不分家,所以也可以把运营划分到产品团队中。 迭代排期会:1h测试用例评审会:1h迭代评审会:1h迭代反思会:1h蓝色部分为各个职能团队内部的会议,折算成全体人员会议时长为2h所以职能型组织架构下,一个迭代开会总时间最少为 12 h,占比12/(8* ,占比8/(8*10)=10.00%。 * * *阅读我的更多文章研发效能组织架构:职能独立vs业务闭环破局DevOps|8大北极星指标指引研发效能方向DevOps | 研发效能价值如何衡量高效能敏捷交付团队反思:特性团队(FeatureTeam
k8s常用命令 node 查看服务器节点 kubectl get nodes 查看服务器节点详情 kubectl get nodes -o wide 节点打标签 kubectl label nodes pods --all-namespaces #查看具体pods,记得后边跟namespace名字哦 kubectl get pods kubernetes-dashboard-76479d66bb-nj8wr --namespace=kube- system 查看pods具体信息 kubectl get pods -o wide kubernetes-dashboard-76479d66bb-nj8wr - kubectl api-versions # API kubectl get events # 查看事件 kubectl get nodes //获取全部节点 kubectl delete node k8s2 # 标记 my-node 不可调度 kubectl drain k8s-node # 清空 my-node 以待维护 kubectl uncordon k8s-node # 标记 my-node 可调度
产研运协同主要工作流程 下图是一个迭代过程中产研运协同时涉及的主要工作流程 绿色的会议为全员参与的会议 粉色为专业职能团队内部的会议 通常来说PO(Product Owner)几乎每天都会梳理用户故事 产研运协同主要工作会议 下表详细列出了在一个迭代中涉及到的主要的会议,包括会议涉及的角色、输入、输出和会议目的。 这里有几点要重点说明 运维和运营小伙伴可以按需参加。 通常产品和运营不分家,所以也可以把运营划分到产品团队中。 测试用例评审会:1h 迭代评审会:1h 迭代反思会:1h 蓝色部分为各个职能团队内部的会议,折算成全体人员会议时长为2h 所以职能型组织架构下,一个迭代开会总时间最少为 12 h,占比12/(8* ,占比8/(8*10)=10.00%。
点击立即体验WeOps众所周知容器(docker)是一艘航行在IT大海里的“轮船”为了驶向彼岸,需要一个“船舵”(K8S)那如何更好更快地前行呢? 你需要“We Operations”统一管理,让船上的“货物”井井有条统一监控,“货物”故障提前感知,更快解决问题下面正式介绍多才多艺的:嘉为蓝鲸一体化运维平台WeOps! 成熟稳定腾讯每年3亿重金打造+超10年持续迭代+支撑30w节点运维实践,构建成熟稳定的运维平台。轻量部署轻量化,支持单机部署,20+年专家经验沉淀+10万用户的市场验证,内置场景,一键启用。
有两种方式来适应这种趋势: 水平扩展 : 即构建管理多个集群的能力,在集群故障隔离、混合云等方面更具优势,主要通过集群联邦(Cluster Federation)来实现; 垂直扩展 : 即提高单个集群的规模,在降低集群运维管理成本 K8s 采用的是一种中心化的架构,所有组件都与 APIServer 交互,而 APIServer 则需要将集群元数据持久化到元信息存储系统中。 etcd 并不是一个专门为 K8s 设计的元信息存储系统,其提供的能力是 K8s 所需的能力的超集。 但是面对 K8s 更大范围的应用之后带来的挑战,我们迫切的需要一个更高性能的元数据存储系统作为 etcd 的替代方案,从而能对上层业务有更有力的支撑。 在调研了 K8s 集群的需求以及相关开源项目之后,我们借鉴了 k3s 的开源项目 kine 的思想,设计并实现了基于分布式 KV 存储引擎的高性能 K8s 元数据存储项目—— KubeBrain 。
嘉为蓝鲸2025秋季IT研运全流程新品发布总览嘉为蓝鲸AIOps、DevOps、WeOps三大产品线2025年秋季新品发布,覆盖IT研发项目管理、IT运维全流程,多款产品齐上新,AI赋能,助力企业高效进行 IT研运,以智能运维提升企业研发效能,促进企业数字化转型!
项目管理工具可以说是产研运工具链上最耀眼的明星,也是产研工作最重要的一环(没有之一)。为什么这样说? 对于我们每个角色(产品、研发、测试、运维、运营、客服等)我们都可以有各自的专业工具来支撑,能让我们每个角色的工作效率很高,但是我们终究是一个为了共同的目标在一起努力的团队。 产研工具链中商业化最好的细分领域在产研运工具链中,涉及的工具大大小小没有一千也有几百,其中项目管理类工具是商业化最好的细分领域。 有的是一些通用的工具(比如 Jira),也可以支撑产研运协作;而有的就是为这个领域垂直打造的工具(比如 tapd)。 虽然多维表格很灵活也很强大,但我依然认为多维表格不是一个很好的支持产研运协同的项目管理工具,这不是它的强项。
/storage/k8s/es 2)创建NFS的rbac [root@k8s-master01 k8s_project]# cd [root@k8s-master01 ~]# cd /opt/k8s/k8s_project / [root@k8s-master01 k8s_project]# mkdir elk [root@k8s-master01 k8s_project]# cd elk/ [root@k8s-master01 1)创建es集群的storage [root@k8s-master01 elk]# pwd /opt/k8s/k8s_project/elk [root@k8s-master01 elk]# mkdir [root@k8s-master01 images]# pwd /opt/k8s/k8s_project/elk/es/images [root@k8s-master01 images]# ll total [root@k8s-master01 es]# pwd /opt/k8s/k8s_project/elk/es [root@k8s-master01 es]# mkdir deploy/ [root@k8s-master01
// MongoDB运维与开发(8)---MongoDB备份与恢复 // 任何数据库都离不开日常的备份与恢复,这二者是数据库安全的前提,MongoDB的备份与恢复方法一般而言都采用自带的工具来进行
Linux运维工程师面试题(8)祝各位小伙伴们早日找到自己心仪的工作。持续学习才不会被淘汰。地球不爆炸,我们不放假。机会总是留给有有准备的人的。加油,打工人! 8 制作镜像方式docker commit # 通过修改现有容器,将之手动构建为镜像docker build # 通过Dockerfile文件,批量构建为镜像9 K8S 有那些组件,都是干什么用的 10 K8S 创建一个pod的流程准备好对应的yaml文件,通过kubectl发送到Api Server中;Api Server接收到客户端的请求将请求内容保存到etcd中;Scheduler会监测etcd 阿里云、腾讯云、华为云、今日头条、百家号、GitHub、个人博客公众号:阿贤Linux个人博客:blog.waluna.tophttps://blog.waluna.top/---原文链接: Linux运维工程师面试题 (8).
上面都是一些显而易见的道理,但是从显而易见或司空见惯的事物中挖掘出营养却是一个非常值得努力的方向 因为这些司空见惯的的事物太多了,但我们未必真懂得其中的内涵或蕴藏的智慧,哪怕只深掘一层,将会发现遍地都是宝藏 作为运维
作为快速入门Kafka系列的第八篇博客,本篇为大家带来的是kafka监控及运维~ 码字不易,先赞后看! ? ---- Kafka监控及运维 在开发工作中,消费在Kafka集群中消息,数据变化是我们关注的问题,当业务前提不复杂时,我们可以使用Kafka 命令提供带有Zookeeper客户端工具的工具 useUnicode=true&characterEncoding=UTF-8&zeroDateTimeBehavior=convertToNull #kafka.eagle.username=root
自研上云与CBS云盘 ? 公司930变革后,开始全面推进 “开源协同,自研上云”,秦时明月作为一款新业务,也必然响应公司战略。 经过与业务协商,运维将现网环境全量部署在自研云上,硬盘这块最开始是使用的高性能CBS云盘。 ? 为什么使用CBS云盘,有2个原因。 第一个原因是:这是当下仅有的选择。 Gamesvr模块出于业务性能上的需求,秦时是使用的是C3高主频机型,到目前为止还没有同时支持高主频和本地盘的自研云机型。 那么问题来了,如何在自研上云的大背景下,既要打印完整的30G大小core文件,又要将core的影响时长控制在20s内。 优化方案2: gzip替换成pigz -p指定8线程压缩(这里为什么不能压缩成tar包,留个伏笔) ?