首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏存储公众号:王知鱼

    微软:AI存储,SSD or HDD ?

    能满足训练和Checkpoint的性能读取(但成本较高); • HDD的成本虽然较低,但带宽性能仍无法达到目前需求,需增长8-10x; • SSD朝着更高带宽/吞吐量前进,需在当前水平提升50-100x; Fig 仍是基于HDD来构建温数据层,减少存储硬件投资; • 在温数据层基于Blob对象存储引擎,和业界现在普遍热议的并行文件系统不同(Fig-5); • HDD/SSD介质发展趋势,AI场景要兼顾容量和性能(Fig

    1.1K10编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    Solidigm:AI数据管道与存储方案

    Fig-7 推理过程,图示数据存储在GPU集群中,主要是随机读;基于RAG的推理会产生额外IO行为。 Fig-8 训练完成的模型,从GPU内存,缓存到全闪存,最终落盘到对象存储层。

    59110编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    AsteraLabs:PCIe 长距离跨节点传输方案

    要点速览 基于PCIe 横向跨节点扩展AI集群的设想(Fig-2) 长距离 PCIe 线缆设计原型、信号处理方法、线缆选型(Fig-7/8/10) Fig-1 AI基础设施扩展挑战 AI模型持续扩展: Fig-6 基于PCIe 扩展CPU计算节点的内存(JBOM) Fig-7 PCIe 布线方案 外部布线覆盖范围的考量(External Cabling Reach Considerations) 1

    1.2K00编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    SuperMicro:AI存储硬件方案

    SuperMicro:AI存储硬件方案-Fig-7 全闪存储系统参数 主要特点(Key Features): • 支持双 Intel 和单 AMD 单 PCIe Gen5 处理器。

    87510编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    Samsung:CXL 内存扩展更新

    Samsung:CXL 内存扩展更新-Fig-7 CMM-HC (Hybrid with Compute)是增强计算功能的分层内存方案,设备模块上增加专用计算卡。

    1.3K10编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    XINNOR:高效RAID的存储实践

    XINNOR:高效RAID存储实践-Fig-7 xiRAID Opus与BlueFiled3集成的实现方案及其优势 1.

    66810编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    MLPerf:AI场景的存储测试标准

    MLPerf:AI场景的存储测试标准-Fig-7 队列深度-Unet3D 横轴队列深度(QD),纵轴操作数占比 • 大峰值:队列深度(QD)在 40 到 52 之间有一个大峰值。

    1K10编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    NAND 闪存面临的机遇与挑战

    NAND 闪存面临的机遇与挑战-Fig-7 NAND行业未来的挑战 (Future Challenges of NAND Industry) 1.

    82210编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    Micron:SSD替换主存,加速AI落地

    Fig-7 GNN 训练,多硬盘延迟测试,评估纵向扩展能力。 图标可见,4x 9550s 训练总时长仅为单盘的一半,多个驱动器并行能明显提高效率。

    48910编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    WD:适配GPU DAS的存储系统设计

    的 Ingrasys ES2100 存储系统 与H100 的差异是:计算单元使用的是PCIe Gen4 的PLX 交换机,存储节点支持12个200GbE接口 WD:适配GPU DAS的存储系统设计-Fig

    86910编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    NVIDIA:LLM集群存储IO行为(实测数据)

    NVIDIA:LLM集群存储IO行为-Fig-7 聚焦初始化读取阶段的读IO行为 • 计算阶段的读取非常低:约3MB/s • I/O很小:< 4KB • 随着节点数量增加,总读取量呈线性增长。

    43010编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    MetisX:从CXL内存扩展到近存计算

    MetisX:从CXL内存扩展到近存计算-Fig-7 近存计算 ? 即将推出的 CXL 计算内存 的硬件与软件设计特点: 1.

    41310编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    Viking Enterprise:企业存储的分层视角

    Viking Enterprise:企业存储的分层视角-Fig-7 Flash Options – Tier 1 1.

    56300编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    Google/Meta:云服务商视角下的CXL应用

    云服务商视角下的CXL内存-Fig-7 建立基准 Google 和 Meta 在 OCP 中引入了一种新的 CXL 设备类别的基础规范,关注成本: 目标: • 可以大规模部署 • 以增量方式扩展平台内存

    1.3K10编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    超微:下一代存储系统接口设计与实践

    参考阅读: • 高性能存储阵列:虽好不一定适合 超微:下一代存储系统接口设计与实践-Fig-7 Gen5 EDSFF Petascale 平台创新 副标题:专为全NVMe和软件定义数据中心设计 1.

    87600编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    忆芯科技:Flash2DRAM 动态数据加载

    Fig-7 未来推理的发展方向 应用场景拓展 推理将更贴近终端用户,提供实时、本地化的功能支持,包括个性化助手、创意生成、实时语言处理等。

    55900编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    PCIe Gen5 互联拓扑设计与经验

    服务器设计 PCIe 5.0 互联拓扑设计-Fig-7 问题:服务器插槽存在总线号和内存地址不足的问题 BIOS 对每个 PCIe CEM 插槽的总线分配 BAR0、BAR1 和 BAR2 的内存地址

    1.8K00编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    Solidigm:CSAL 云存储加速层实现与优势

    Solidigm:CSAL 云存储加速层实现与优势-Fig-7 Open-CAS 与 CSALappend 缓存之间的缓存设备写入放大因子(WAF)对比,这是衡量 SSD 写入效率的重要指标。

    73700编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    KIOXIA:使用SSD加速RAG场景落地

    :2 x CD8P-R 15.36TB 硬盘,RAID 0 测试结论: • Recall@10值在92以上,DiskANN检索准确性、QPS均高于HNSW KIOXIA:使用SSD加速RAG场景落地-Fig

    58010编辑于 2025-02-11
  • 来自专栏存储公众号:王知鱼

    CXL调优:基于负载感知的TMC模型

    Fig-7 模型构建方法 图表详细展示了如何生成之前提到的“性能模型”。模型的构建过程始于一个关键的性能分析步骤 (Profiling Step)。

    35710编辑于 2025-04-27
领券