
阅读收获
全文概览
随着NVMe SSD和持久内存等高速介质的普及,传统以CPU为中心的存储I/O栈正成为性能瓶颈。为了绕过内核、减少数据拷贝和上下文切换,业界探索了从用户态文件系统(UserFS)到设备端文件系统(DeviceFS)乃至计算下沉等多种优化路径。然而,当CXL、FPGA等新技术将算力推向存储边缘,AI负载的需求从“管理数据”转向“理解数据”时,我们不禁要问:那个作为软硬件桥梁、默默服务了数十年的文件系统,它的角色是否正在被解构?在以数据为中心的新世界里,文件系统还能幸存吗,抑或将以何种新形态重生?
👉 划线高亮 观点批注

图片的核心观点在于阐述文件系统作为“中间人”的关键角色:

图片的核心观点在于解构存储IO开销的本质并分类现有的解决方案:
===
特性维度 | 1. KernelFS (内核态文件系统) | 2. UserFS (用户态文件系统) | 3. DeviceFS (设备端/固件文件系统) | 4. Compute Offloading (计算卸载/近数据计算) |
|---|---|---|---|---|
核心逻辑位置 | OS Kernel (操作系统内核) | User Space (应用层库) | Storage Firmware (存储设备固件) | Kernel (管理) + Device (计算) |
I/O 路径特征 | App -> Kernel -> Storage | App -> Lib -> Storage (旁路内核) | App -> Lib/Kernel -> Firmware FS | App -> Kernel -> Data Processing |
解决的核心痛点 | 通用性与硬件兼容性 | 系统调用 (Syscall) 开销、上下文切换 | 主机 CPU 负载、文件系统元数据管理开销 | 数据移动 (Data Movement) 开销、PCIe 带宽瓶颈 |
优势 (Pros) | 1. 标准化,兼容所有 POSIX 应用 2. 安全性高,隔离性好 3. 技术最成熟 | 1. 消除内核陷入/上下文切换开销 2. 针对特定应用 (如 DB) 定制优化 3. 极低延迟 | 1. 彻底卸载文件系统逻辑,释放主机 CPU 2. 随着存储设备增加,算力线性扩展 3. 减少主机与设备间的交互次数 | 1. 大幅减少无效数据传输 (如过滤、压缩) 2. 节省内存带宽和 PCIe 带宽 3. 适合大数据扫描/分析场景 |
劣势/挑战 (Cons) | 1. 上下文切换频繁 (User <-> Kernel) 2. 数据在用户态/内核态间多次拷贝 3. 对新型高速介质 (如 PMem) 可能是瓶颈 | 1. 应用隔离性较差 (Bug 可能损坏 FS) 2. 需要修改应用或链接特定库 3. 多进程共享数据较复杂 | 1. 依赖特定硬件 (SmartSSD/FPGA) 2. 固件开发难度大,难以调试 3. 标准化程度低 | 1. 编程模型复杂 (需定义卸载什么任务) 2. 通用性受限 (通常针对特定数据库或格式) 3. 硬件资源受限 (设备端算力不如 CPU) |
代表案例 (来自PPT) | ext4-DAX, F2FS, NOVA | Strata, SplitFS, FSP | DevFS, Insider, CrossFS | PolarDB, Newport CSD, ScaleFlux |

图片探讨了文件系统在新型硬件(CXL, FPGA) 和新型负载(AI) 冲击下的生存状态:

图片的核心观点是:文件系统将消亡,或者说被“认知计算栈”完全吞噬。
延伸思考
这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~
原文标题:Can file systems survive in data-centric world?[1]
Notice:Human's prompt, Datasets by Gemini-3-Pro
#FMS25 #文件系统
---【本文完】---

丰子恺-护生画集-我来施食尔垂钓
👇阅读原文,搜索🔍更多历史文章。