首页
学习
活动
专区
圈层
工具
发布

DeepSeek V4,真的要来了

据多方权威消息,DeepSeek将在春节前后发布V4。继续混合架构(自V3.2后一直如此),这意味着不会有R2了。定位旗舰型编程模型,专攻“生产级编程”,直接对标Claude。可一次性理解数万行代码,对企业级复杂项目更友好。训练过程首次引入了新架构mHC,大幅解决“灾难性遗忘”问题。即使小模型(据说10GB显存都可以配置),推理能力也翻了好几倍。同时,据可靠消息,智谱GLM-5、Kimi K2也大概率是在这个时间点发布。嚯,这下2026春节热闹了。加班,走起!

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O45WLpwQgpAs-A_REtWlDbvg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券