首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏云服务与SRE架构师社区

    给你10个路由器或交换机,你如何配置?

    三层架构面临的主要问题包括:低可扩展性、低容错性、内部服务器之间横截面带宽低、较高层超额使用(Oversubscription)、高层次的拓扑中使用的大型模块化交换机成本非常高。 二、Leaf-Spine二层网络架构 Leaf-Spine网络架构解决了传统三层网络架构所面临的Oversubscription和内部服务器之间横截面带宽问题。

    2K40发布于 2019-07-31
  • 一文搞懂 GPU 共享方案: NVIDIA Time Slicing

    什么是 Time Slicing 方案NVIDIA 提供的 Time-Slicing GPUs in Kubernetes 是一种通过 oversubscription(超额订阅) 来实现 GPU 共享的策略 但是 Time Slicing 可以进行 oversubscription 设置,将 device-plugin 上报的 GPU 数量进行扩大。 resources: - name: nvidia.com/gpu replicas: 4这里我们关注 resources 中的 replicas 参数,正是这个参数定义了 oversubscription **TimeSlicing 是一种通过 oversubscription(超额订阅) 来实现 GPU 共享的策略,这种策略能让多个任务在同一个 GPU 上进行,而不是每个任务都独占一个 GPU。

    72110编辑于 2025-05-20
  • 来自专栏GPUS开发者

    DAY2:阅读CUDA C Programming Guide之编程模型

    This capability enables oversubscription of device memory and can greatly simplify the task of porting

    1.1K40发布于 2018-06-25
  • 来自专栏罗西的思考

    [源码解析] NVIDIA HugeCTR,GPU 版本参数服务器 --(1)

    4.5 嵌入训练缓存 嵌入训练缓存(Model Oversubscription)使您能够训练高达 TB 的大型模型。 Fig. 7: Preprocessing of dataset for model oversubscription 图来自源码。

    1.5K20编辑于 2022-05-09
  • 来自专栏DeepHub IMBA

    TensorRT 和 ONNX Runtime 推理优化实战:10 个降低延迟的工程技巧

    so.intra_op_num_threads = 1 # one thread per operator often stabilizes latency so.inter_op_num_threads = 1 # avoid oversubscription

    54410编辑于 2025-11-15
  • 来自专栏存储公众号:王知鱼

    PCIe 6.0:AI时代的算力互连枢纽与架构翻转

    === 洞察(技术细节深挖): 收敛比(Oversubscription)分析: 下行带宽: 6个设备 x 16 Lane = 96 Lanes。

    78510编辑于 2025-12-21
  • 来自专栏GPUS开发者

    DAY90:阅读Data Migration and Coherency

    GPU Memory Oversubscription Devices of compute capability lower than 6.x cannot allocate more managed

    80910发布于 2018-12-14
  • 来自专栏C++ 动态新闻推送

    快报!c++26 最新进展!Sofia会议

    通过较为宽松的wording给了实现很大的自由度来接入操作系统的调度器,同时避免了直接往标准中加入线程池可能导致的oversubscription问题,并且让P2300的hello world例子终于可以跑通了

    93810编辑于 2025-06-23
  • 来自专栏专注数据中心高性能网络技术研发

    [Effective Modern C++(11&14)]Chapter 7: The Concurrency API

    Thread-based programming calls for manual management of thread exhaustion, oversubscription, load balancing

    1.1K50发布于 2018-05-26
  • 来自专栏GPUS开发者

    DAY89:阅读Unified Memory Programming

    or newer) provide additional Unified Memory features such as on-demand page migration and GPU memory oversubscription

    1.3K30发布于 2018-12-13
  • 来自专栏毅硕HPC

    毅硕HPC | InfiniBand网络在HPC集群中的核心应用

    交换机数量随规模平方增长,成本高设计要点:设每台叶交换机(Leaf)连接 N 台服务器 → 共需 Leaf 数量 = 总节点数 / N核心交换机(Spine)数量 ≥ N,确保任意两叶间有直达路径推荐比例:3:1 oversubscription

    73110编辑于 2026-01-07
  • 一文梳理:如何构建并优化GPU云算力中心?

    来源:星融元(Asterfusion)星智AI网络解决方案确定合适的超额订阅率轨道优化拓扑的另一个好处可以超额订阅(Oversubscription)。

    2.5K11编辑于 2024-10-24
  • 从零开发分布式文件系统(5.4):如何优化线程模型以提升NVMe SSD性能

    The problem with high oversubscription.

    21310编辑于 2026-01-05
  • 来自专栏新智元

    有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

    比如,Meta的上一代GPU集群架构使用了3.2万张芯片,总共有8个计算岛,岛与岛之间部署全速带宽,然后在顶部另加一个7:1的收敛比(oversubscription)的交换层,于是岛与岛之间的联网速度就是岛内的七分之一

    1.9K10编辑于 2024-06-27
  • Flink on YARN深度解析:Session与Per-Job模式的部署与原理

    优化方向: 资源超卖与共享:在 Session 模式下,通过调整 taskmanager.cpu.cores 和内存参数实现资源超卖(oversubscription),但需谨慎监控以避免整体集群过载。

    45010编辑于 2025-11-28
  • 来自专栏木二天空

    047.集群管理-资源及配额管理

    通过这种机制,Kubernetes可以实现节点资源的超售(OverSubscription),比如在CPU完全充足的情况下,某机器共有32GiB内存可提供给容器使用,容器配置为Requests值1GiB

    1.8K30发布于 2020-04-08
领券