首页
学习
活动
专区
圈层
工具
发布

#cpu

智能体时代CPU回“C位”,英特尔至强6+重塑AI底座

芯智讯

2026年6月5日,在北京召开的在英特尔至强 6+ 新品发布会暨数据中心创新日上,英特尔给出了其对AI时代下一个关键转折点的判断:当AI从大模型训练全面转向Ag...

3710

故障演练 :人为打满 CPU,Grafana 会发生什么?

一根头发丝的宽度

在前一篇文章中,梳理了 Kubernetes 集群健康检查的核心监控指标。 其中 CPU 使用率是最基础、也最容易引发误解的指标之一。

3910

缓存技术:从CPU Cache到AI KV Cache (四)Web缓存

霞姐聊IT

一次跨国HTTP请求可能需要几十毫秒甚至几百毫秒,而CPU一次运算只需纳秒级,SSD读取也仅需百微秒级。

10410

缓存技术:从CPU Cache到AI KV Cache (三)数据库缓存

霞姐聊IT

内核看到的是Page1、Page2、Page3这样一个一个的数据块,但它不知道这些数据块里面存放的是哪些业务内容。所以内核的缓存策略是比较粗暴的,但数据库更懂数...

12710

黄仁勋:Vera CPU为智能体而生,中国市场将严守合规!

芯智讯

6月2日,英伟达(NVIDIA)创始人兼CEO黄仁勋在GTC Taipei全球媒体问答活动中,围绕公司AI时代的战略布局,从中国市场策略到台湾供应链合作,再到全...

13410

缓存技术:从CPU Cache到AI KV Cache (二)Linux内核Cache

霞姐聊IT

上一节介绍了CPU 与内存之间的速度差及其解决方案,本节我们关注内存与磁盘之间的速度差,以及操作系统和数据库等软件如何通过缓存机制缓解这一瓶颈。

10410

【译】Accountsd:如何解决 Mac 上的高 CPU 占用问题

AlphaHinex

在 macOS Catalina 10.15.7[2] 版本发布后,越来越多的用户遇到了一个名为 “accountsd” 的系统进程在活动监视器中占用 CPU ...

25110

云数据库MySQL CPU弹性扩容:按需计费模式实现日成本最高降低98.9%

IT资讯研究所

腾讯科技 | 研究员 (已认证)

腾讯云数据库MySQL推出CPU弹性扩容功能与集群版新架构,解决传统固定规格部署的资源浪费、运维成本高、架构灵活性不足等问题。CPU弹性扩容支持自动/手动两种模...

12410

CPU弹性扩容:按需计费的数据库性能动态保障方案

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

应对突发流量导致的数据库性能瓶颈 在电商大促、游戏上线、节假日出行等业务高峰场景下,突发流量易导致数据库CPU使用率飙升,引发连接数过多、查询缓慢等性能瓶颈。传...

13110

腾讯云数据库MySQL演进:CPU弹性扩容与集群版驱动98.9%成本下降与50%性能跃升

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

腾讯云数据库MySQL针对突发流量带来的资源损耗与运维痛点,推出了基于Serverless的CPU动态弹性扩容与存算解耦的集群版架构。该技术演进不仅实现了单日成...

11410

趣丸科技基于TKE与TTSet混部方案将CPU利用率从8%提升至50%以上

IT资讯研究所

腾讯科技 | 研究员 (已认证)

趣丸科技作为中国领先的国家高新技术企业,旗下拥有TT语音等覆盖兴趣社交、AI及电竞业务的2亿+注册用户产品。面对全网主机CPU利用率仅8%的低效瓶颈,企业采用“...

9810

趣丸科技基于TKE集群的混部实践:CPU利用率从8%提升至50%以上

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

应对在线业务潮汐与资源闲置的行业挑战 社交与电竞业务存在显著的流量波峰波谷,导致趣丸科技全网主机CPU平均利用率长期低于10%(实际为8%)。高并发直播等在线业...

8210

趣丸科技:基于TKE三层混部架构实现CPU利用率跃升至50%以上的技术实践

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

趣丸科技为解决全网CPU资源利用率低下的痛点,依托腾讯云TKE构建了“调度优先、隔离辅助”的三层离在线混部架构。该方案通过自研TTSet系统实现集群级精准调度,...

10710

腾讯云数据库CPU弹性扩容2.0:秒级响应与成本优化实践

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

应对流量洪峰与资源浪费的双重挑战 传统云数据库采用固定规格部署,面临两大核心痛点:资源规划难度高,调整规格需人工评估且升级过程可能导致服务闪断;运维成本居高不下...

10310

缓存技术:从CPU Cache到AI KV Cache (一)

霞姐聊IT

网络络延迟的范围很大:数据中心内部访问可能只需要几微秒,而跨地域访问往往达到数十到数百毫秒,甚至超过本地磁盘访问延迟。

9210

星辰CPU+Ethos NPU,安谋科技助力Synaptics打造AI MCU

芯智讯

当前,AI正在从云端向边缘侧下沉,越来越多AI推理工作直接在本地执行。边缘AI凭借低时延、隐私安全、高可靠性、高能效比、带宽与存储成本优化等系统性优势,正加速迈...

18210

生产环境惊魂:慢SQL导致CPU飙升至99%?教你用Python写个“自动清道夫”!

俊才

周一早上刚到公司,运维群里突然炸锅:“生产环境数据库CPU飙升到100%了!”、“系统响应极慢,接口大量超时!”、“前端页面直接白屏了!”……

12810

手撕 GPT#04:我用CPU花20分钟训练了一个满分模型,问它一个问题,后悔了

烟雨平生

这件事发生在我训练一个3M中文GPT小模型的时候。所有教程都不会告诉你答案。今天我来讲。

13310

手撕 GPT#01:五分钟上手,手把手带你用CPU 原生训练中文GPT模型,“我没有 GPU”的问题解了!!!

烟雨平生

问:什么是注意力机制? 答:注意力机制通过计算查询和键的相关性分配权重,让模型动态关注最相关的部分。 问:RoPE 是什么? 答:RoPE 是旋转位置编码,...

15110
领券