集群 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签集群

#集群

借助重新设计的 AutoOps，更快地排查 Elasticsearch 问题

点火三周 1小时前2026-07-27 16:18:27

大规模运行 Elasticsearch 要求管理员同时监控集群的健康状况、性能、容量和配置。AutoOps 现在提供了一种更清晰的方式，来区分威胁集群功能的状况...

000

Kubernetes NodePort 服务网络架构与底层工作原理深度解析

云技术以及云存储 3小时前2026-07-27 13:45:11

在 Kubernetes 微服务网络体系中，NodePort 是介于 ClusterIP 内网服务与 LoadBalancer 负载均衡服务之间的标准化外网流量...

100

自建 ELK 还是用腾讯云CLS？算完这笔账我沉默了

克劳德2048 2天前2026-07-24 20:40:56

然而随着业务规模扩大和云原生架构普及，越来越多的团队开始重新评估这条路径。日志量从每天几 GB 增长到几十甚至上百 GB 时，ELK 集群的扩容复杂度、存储成本...

7010

白宫急了，高管炮轰Kimi K3蒸馏偷技术

陈序员大康 3天前2026-07-24 16:05:09

7月22日，白宫科技政策主管Michael Kratsios在X上发了一条帖子。措辞罕见地强硬。

12100

Kafka 监控这块我踩了两年坑，今天把从 JMX 到 Grafana 的全套方案掏给你

悠悠12138 3天前2026-07-23 19:44:54

Controller 数量。整个集群应该只有一个 Controller，如果监控显示 0 个或者 2 个，那你集群基本要出大事了，脑裂了。

10300

一次 Kafka 集群磁盘写满后，我把这些底层原理全捋了一遍

悠悠12138 4天前2026-07-22 18:53:27

上个月某天凌晨，告警群里突然炸了：Kafka 集群某台 broker 磁盘使用率 95%，马上要撑爆。

15310

“十万卡”起跑线刷新，曙光8000踏出关键一步！

科技旋涡 6天前2026-07-21 13:45:02

总体来看，十万卡集群的竞争，本质上是“存算网”协同的系统工程能力之争。网络、存储、散热、调度等关节，决定了集群的实际算力输出能打多少折扣。

17110

WAIC 2026镇馆之宝落地出圈！曙光8000（登峰）十万卡国产超集群满载稳跑，赋能AI产业创新

IT狂人日志 6天前2026-07-21 13:22:51

2026年世界人工智能大会（WAIC）正在上海火热启幕，本届大会重磅“镇馆之宝”——国内首个全国产十万卡AI超集群曙光8000（登峰）迎来全球首展。凭借独创的超...

13410

2026 WAIC｜曙光8000十万卡AI超集群上线第一周就跑满了

释然IT杂谈 6天前2026-07-21 10:12:57

7月18日，2026世界人工智能大会（WAIC）在上海世博展览馆正式开幕。本届大会“镇馆之宝”之一——中国首个全国产十万卡AI超集群曙光8000（登峰）完成全...

27910

98.9% 更快的查询，4倍的索引吞吐量：Elasticsearch 性能系统诊断

点火三周 6天前2026-07-21 09:16:59

三个 Elastic 工具 (AutoOps、Profile API 和 ES Rally) 能够系统地诊断堆栈每一层面的 Elasticsearch 性能问题...

9610

华为超节点是什么？上海 WAIC 看完，我终于搞懂了

不吃草的牛德 6天前2026-07-21 09:16:11

注意关键词：不是把一堆服务器用网线攒起来（那是传统集群），而是让几百张卡之间像在同一块主板上一样，能高频、低延迟地互相访问彼此的算力和内存。

22610

昆仑芯M100曝光：全国产，对标H20！

芯智讯 6天前2026-07-21 09:03:13

2025年4月，百度成功点亮了基于基于P800的3.2万卡的超级集群，能够同时承载多个千亿参数大模型的训练任务。这种集群搭建与运营能力，是芯片“好用”的核心壁垒...

17110

曦智科技51.2T CPO原型亮相，核心全国产

芯智讯 6天前2026-07-21 09:02:40

在2026世界人工智能大会（WAIC 2026）上，曦智科技以“光³——定义AI算力的三次方时代”为主题，从光互连、光计算、光交换三个维度，带来了一系列技术进展...

24510

突破互联瓶颈！摩尔线程MTT C256超节点亮相WAIC

芯智讯 6天前2026-07-21 09:01:21

• 万亿参数MoE模型训练：依托万卡级夸娥智算集群与夸娥AI训练套件（KUAE Training Suite），摩尔线程完成了从零起步的MoE-236B基础模型...

22210

三款AI推理芯片+超节点异构集群，云天励飞WAIC重磅发布

芯智讯 6天前2026-07-21 08:58:22

依托三款专用芯片，云天励飞将搭建万卡（十万卡）级异构集群分离式AI推理基础设施。通过解耦各推理阶段，为不同负载匹配适配的芯片与算力资源，有效提升集群系统运行效率...

13010

曙光8000全国产十万卡AI超集群真机全球首秀

芯智讯 6天前2026-07-21 08:56:13

7月17日，以“智能伙伴，共创未来”为主题的2026世界人工智能大会（WAIC）在上海开幕。大会期间，中国首个全国产十万卡AI超集群——曙光8000（登峰）真机...

13410

曙光8000首周满载：国产十万卡AI超集群，到底强在哪？

码哥字节 6天前2026-07-21 08:36:34

这是区别于传统大规模集群的核心网络优势。单子网支持 11.4 万卡规模，网卡端到端时延小于 1 微秒，交换机转发时延 260 纳秒，单端口 800G；具备毫秒...

23710

让Spark和Ray跑在同一平台：腾讯云AI DLC即将发布

腾讯QQ大数据 6天前2026-07-20 20:50:06

资源浪费。两套集群各自预留资源，Spark 集群白天跑批晚上空着，GPU 集群训练完也空着。算力不能共享，成本不能摊薄。

13000

K8s可视化工具横评，最后我选了这个

用户11081884 6天前2026-07-20 20:40:29

从 kubectl 的黑白命令行，到如今琳琅满目的图形化管理界面，Kubernetes 的可视化生态已经相当繁荣。但对于一个刚刚上马K8s，或者正被原生命令行折...

15000

用了KubeSphere之后，我觉得K8s没那么难了

用户11081884 6天前2026-07-20 20:32:48

曾几何时，面对黑压压的命令行和错综复杂的YAML文件，Kubernetes（K8s）对于许多开发者和运维人员而言，是一座需要仰望的技术高山。集群管理、应用部署、...

8700

#集群

借助重新设计的 AutoOps，更快地排查 Elasticsearch 问题

Kubernetes NodePort 服务网络架构与底层工作原理深度解析

自建 ELK 还是用腾讯云CLS？算完这笔账我沉默了

白宫急了，高管炮轰Kimi K3蒸馏偷技术

Kafka 监控这块我踩了两年坑，今天把从 JMX 到 Grafana 的全套方案掏给你

一次 Kafka 集群磁盘写满后，我把这些底层原理全捋了一遍

“十万卡”起跑线刷新，曙光8000踏出关键一步！

WAIC 2026镇馆之宝落地出圈！曙光8000（登峰）十万卡国产超集群满载稳跑，赋能AI产业创新

2026 WAIC｜曙光8000十万卡AI超集群上线第一周就跑满了

98.9% 更快的查询，4倍的索引吞吐量：Elasticsearch 性能系统诊断

华为超节点是什么？上海 WAIC 看完，我终于搞懂了

昆仑芯M100曝光：全国产，对标H20！

曦智科技51.2T CPO原型亮相，核心全国产

突破互联瓶颈！摩尔线程MTT C256超节点亮相WAIC

三款AI推理芯片+超节点异构集群，云天励飞WAIC重磅发布

曙光8000全国产十万卡AI超集群真机全球首秀

曙光8000首周满载：国产十万卡AI超集群，到底强在哪？

让Spark和Ray跑在同一平台：腾讯云AI DLC即将发布

K8s可视化工具横评，最后我选了这个

用了KubeSphere之后，我觉得K8s没那么难了

热门专栏

腾讯云中间件的专栏

腾讯云 DNSPod 团队

腾讯云服务器团队的专栏

云鼎实验室的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐