不是更大，而是更聪明：DeepSeek-V4用“记忆+专家”双引擎颠覆大模型范式—压缩稀疏注意力、DSA、Lightning Indexer

jack.yang

发布于 2026-04-24 13:47:43

2210

概述

在人工智能大模型竞赛陷入“规模军备竞赛”的泥潭之际，深度求索（DeepSeek）于2026年4月24日发布了其划时代的 **DeepSeek-V4 预览版**。V4的发布标志着行业范式的根本性转变——从追求“更大”的参数规模，转向构建“更聪明”的智能架构。其核心创新在于一套名为“**双轴稀疏架构**”的系统性设计，该架构由两大引擎驱动：“Engram条件记忆引擎”与“MoE混合专家计算"

文章被收录于专栏：大模型系列大模型系列

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

token