首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏百科知识

    DeepSeek V4发布,改写全球AI规则,产业链全线爆发

    DeepSeekV4发布,改写全球AI规则,产业链全线爆发摘要DeepSeekV4正式发布,携mHC架构与Engram条件记忆两大底层创新,实现百万Token上下文、算力利用率85%、推理成本降90%的核心突破 正文一、AI格局重塑:DeepSeekV4发布,凭什么改写全球规则?2026年春节前后,AI圈迎来里程碑式事件——DeepSeekV4正式登场。 一句话总结:别人靠堆芯片拼性能,DeepSeekV4靠算法优化挖潜力,这正是它能改写全球AI规则的核心底气。 四、投资主线:五大方向最受益,把握产业链爆发机遇DeepSeekV4引发的产业变革,背后暗藏着巨大的投资机遇。 5.大模型生态与合作方核心逻辑:DeepSeekV4将持续完善开源生态,开发者数量将快速增长。

    6.3K50编辑于 2026-02-12
  • 来自专栏大模型系列

    打造你的百万上下文AI智能体:OpenClaw深度集成DeepSeek V4全攻略—— 解锁 DeepSeek-V4 的百万上下文与 MoE 架构

    本文将为您提供一份从零开始、深入浅出的完整指南,详细阐述如何将OpenClaw与DeepSeekV4进行无缝集成。 DeepSeekV4是什么?根据官方于2026年4月24日发布的公告,DeepSeekV4是深度求索(DeepSeek)推出的全新一代大语言模型。 我们将通过修改此文件来添加DeepSeekV4作为新的模型提供商。 我们将其设置为我们想要的DeepSeekV4模型。 观察响应:如果一切配置正确,您将收到来自DeepSeekV4的回复,并且它会自豪地告诉您它支持1,000,000tokens的上下文。

    1.5K50编辑于 2026-04-24
  • 抛弃CUDA生态,万亿参数全栈国产化——拆解DeepSeek V4的「飞行换引擎」

    抛弃CUDA生态,万亿参数全栈国产化——拆解DeepSeekV4的「飞行换引擎」大家好,我是摘星,今天我们来拆解一下DeepSeekV4把万亿参数大模型从英伟达CUDA全面迁移到华为昇腾这件事。 二、DeepSeekV4架构全解析:万亿参数只激活3%在深入迁移细节之前,先搞清楚DeepSeekV4本身的技术架构。这个模型的参数规模约1万亿,但每次推理只激活大约370亿参数——不到总量的4%。 DeepSeekV4最引人注目的不是模型本身,而是它完成了从CUDA到CANN的全面迁移。 CANN从2021年推出到DeepSeekV4完成迁移,只用了5年。 四、DeepSeekV4实战:从API调用到本地部署理解了架构和迁移背景,来看看怎么实际使用DeepSeekV4

    839130编辑于 2026-04-24
  • 来自专栏热度文章

    别卷了,DeepSeek V4 来交卷了

    别卷了,DeepSeekV4来交卷了最近这一周,我的状态基本上就是:早上起来装一个模型,中午吃饭测一个模型,晚上睡觉前又发一个模型。昨天最离谱。 我寻思这下总能睡了吧,结果今天早上闹钟还没响,DeepSeekV4的发布公告直接把我炸醒了。我现在打开GitHub的姿势,你感受一下:这波模型大战的密度,我已经记不清上一次是什么时候了。 DeepSeekV4最拿得出手的是SimpleQA这类知识型测试,跟Gemini3.1Pro咬得很紧,在开源圈属于断档领先。其他几项就比较中规中矩,第一梯队是稳的,但没有拉开明显差距。 DeepSeekV4目前排第三,压在前面的是GLM-5.1和还没完全开源的MiMo。这个榜单变化很快,今天你是第三,明天可能就第五了,且看且珍惜。Agent能力那一栏我多看了两眼。

    16431编辑于 2026-04-24
  • DeepSeek V4来了,英伟达反而涨了:市场到底在买什么?

    DeepSeekV4这场发布会,放在一年前可能会让华尔街再经历一次“英伟达时刻”。为什么这次不行了?二、再看DeepSeek这边:牌打得不一样了先简单梳理一下V4到底发了什么。 而DeepSeekV4适配华为昇腾这件事的意义就在于:它证明了“中国顶级大模型+国产算力芯片”这条路走得通。虽然目前国产芯片跟英伟达最新产品相比还有差距,但差距在收窄。 DeepSeekV4适配华为昇腾,说明中国AI产业在走自己的路,不再完全依赖外部供应链。这两件事不矛盾。我反倒觉得,如果只能靠英伟达一家公司撑起整个AI时代,那才是行业最大的风险。 我的观点市场没有因为DeepSeekV4而恐慌,不是因为DeepSeek不够强,而是因为这次所有人终于看明白了一件事:AI产业的蛋糕正在越做越大,而不是在抢同一块蛋糕。

    16110编辑于 2026-04-25
  • 来自专栏低代码平台

    DeepSeek V4 来了!超越 Claude Sonnet 4.5,赶紧对接 Claude Code 体验一把

    DeepSeekV4来了! DeepSeekV4的Vision模式已经在规划中,API开放后这个问题会从根本上解决。 等DeepSeekV4的Vision模式开放API,这套方案才算真正补全了最后一块拼图。在那之前——纯代码任务、脚本自动化、文本推理,放心用;涉及图片的,暂时留一个Claude原生的后路。

    49330编辑于 2026-04-24
  • DeepSeek V4来了:百万字记忆,十分之一的价格,和一群等了太久的人

    4月24号中午,我正在工位上改一个调了三天的Bug,微信群突然炸了——"DeepSeekV4发了!"我第一反应是:终于。说实话,从今年2月等到4月,整个AI圈都在等这支靴子落地。 路透社4月3号确认了这个消息,华为计算官方微信同日发文称"昇腾超节点产品全面支持DeepSeekV4"。从"卡脖子"到"自主可控",这四个字背后是多少工程师的头发,只有经历过的人才知道。跑分怎么样? 掘金上有一位开发者写了一段话,我觉得说到了所有人的心坎里:"DeepSeekV4不需要比Claude聪明,它只需要便宜50倍。 和KimiK2.6同台竞技:中国开源的"双雄时代"巧的是,就在DeepSeekV4发布的4天前,月之暗面刚刚发布了KimiK2.6。两大中国开源模型前后脚亮相,让整个AI圈热闹得像过年。 4000协作步骤价格0.30/0.30/0.30/0.50per1M0.95/0.95/0.95/4.00per1M硬件华为昇腾未公开我的看法:如果你需要的是通用能力强、价格极致便宜、超长上下文处理,DeepSeekV4

    6200编辑于 2026-04-25
  • 当所有人都在堆参数的时候,DeepSeek V4悄悄做了三件别人不敢做的事

    当所有人都在堆参数的时候,DeepSeekV4悄悄做了三件别人不敢做的事大家好,我是摘星,今天我们来拆解一下DeepSeekV4——一个即将在四月下旬发布的万亿参数大模型。 如果你对大模型行业的关注停留在"谁的参数多、谁的跑分高"这个层面,那你可能会错过DeepSeekV4真正有意思的地方。这个模型的核心竞争力不是1万亿参数——这个数字在今天已经不算稀奇。 3.3打破了什么限制Engram的实际效果是:DeepSeekV4能够在100万token的上下文窗口中实现高效的长距离信息检索,同时GPU显存占用控制在合理范围内。 六、华为芯片+国产模型:这盘棋比你想的大DeepSeekV4还有一个容易被忽略但极其重要的细节:它将全面适配华为昇腾910C平台。 七、对开发者的实际影响说了这么多架构层面的东西,回到一个实际问题:DeepSeekV4对普通开发者意味着什么?

    77730编辑于 2026-04-18
  • 35倍推理加速,成本砍掉97%——DeepSeek V4要重写大模型游戏规则

    35倍推理加速,成本砍掉97%——DeepSeekV4要重写大模型游戏规则大家好,我是摘星,今天我们来拆解一下DeepSeekV4——这个还没正式发布就已经让整个AI圈屏住呼吸的万亿参数怪兽。 2026年4月下旬,DeepSeekV4即将正式亮相。创始人梁文锋在内部沟通中确认了这个时间窗口,路透社和TheInformation也相继跟进报道。 倍减轻长序列压力连接优化mHC流形约束约1.5倍提升训练稳定性系统优化算子融合+量化约2倍降低推理延迟硬件适配昇腾950PR等约1.5倍拓展国产芯片生态综合多维度叠加约35倍成本降低97%五、实操:如何为DeepSeekV4 六、行业影响:不只是技术问题DeepSeekV4的影响远不止于技术层面。它在产业格局、开源生态和地缘技术竞争三个维度上都可能产生深远影响。 展开代码语言:TXTAI代码解释graphLRA[DeepSeekV4发布]-->B[技术层面]A-->C[产业层面]A-->D[生态层面]B-->B1[架构范式转换:mHC+Engram]B-->B2

    3.4K120编辑于 2026-04-15
  • 来自专栏Alter聊科技

    DeepSeek V4炸场背后:硅谷在“造墙”,中国在“修路”

    4月24日上午,姗姗来迟的DeepSeekV4终于显露真身。 翻看DeepSeekV4的技术文档,详细描述了模型的架构,其中一个重要升级是把大部分模块的优化器从AdamW换成了Muon,实现了更快的收敛速度、更优的训练稳定性。 让人欣慰的是,国产模型和国产算力的融合越来越紧密:DeepSeekV4的技术文档中,将昇腾NPU与英伟达GPU并列写入了硬件验证清单;月之暗面在最新的论文中将大模型推理的预填充和解码运行在了不同芯片上,

    4700编辑于 2026-04-26
  • 来自专栏AI资讯

    [AI·资讯] 众望所归!DeepSeek V4 价格表暗藏玄机!联手昇腾950,AI界“雷军”实锤了!

    DeepSeekV4价格表暗藏玄机!联手昇腾950,AI界“雷军”实锤了!【最新AI】专栏更新!今天整个科技圈都被DeepSeek-V4的发布刷屏了。

    2K860编辑于 2026-04-24
  • Claude和GPT同一天发新模型,这次真是硬碰硬

    DeepSeekv4据说也快来了,春节前这几天,AI圈应该还会有不少动静。说到底,这种"神仙打架"对我们用户来说是好事。竞争越激烈,模型进步越快,价格也越有可能降下来。

    45820编辑于 2026-02-06
  • 来自专栏技术人生黄勇

    8小时从零构建Linux桌面 |最强开源模型 GLM-5.1

    官方还给了另外两个长期任务的例子: GLM-5.1开源:一个独立工作8小时的模型 写到这里,就听说 DeepSeek 4月下旬正式发布新一代大模型DeepSeekV4,很期待有些什么新特性。

    39610编辑于 2026-04-14
  • 来自专栏机器学习与统计学

    DeepSeek V4 传下周发布,核心架构组件曝光,这次可能是真的

    V4 如果能兑现这些技术承诺,那真的可以说是"2026 年国产 AI 的破局之作" 拭目以待,下周分晓 #DeepSeek #DeepSeekV4 #MoE #国产算力 #大模型 制作不易,如果这篇文章觉得对你有用

    10410编辑于 2026-04-24
  • 来自专栏AI周报

    AI周报 | 算力涨价近半、融资965亿、AI开始像真人员工

    DeepSeekV4(预告4月下旬发布)-它的规模特别大,有1万亿个“脑细胞”(参数),但干活时只激活一小部分,所以**快、省电**。-测试版里还出现了“看视频模式”,说明它很可能能看懂视频。

    30910编辑于 2026-04-20
  • DeepSeek V4 预览版:一次面向“推理时代”的阶段性宣告

    DeepSeekV4预览版:一次面向“推理时代”的阶段性宣告当DeepSeek以“V4预览版”的形式向外界开放时,行业的敏感神经会被立刻触发:这不是一次常规版本号迭代,而更像一种研究共同体式的信号——我先把关键能力放出来

    9600编辑于 2026-04-24
  • 来自专栏用户11910509的专栏(2)

    从零开始,在国内用上 Claude Code 保姆教程(含 CC Switch 配置详解)

    还没等大家缓过神来,这周:GPT-5.5悄然上线;GPT-image-2让文生图卷出了新高度;DeepSeekV4带着超长上下文杀回战场;连小米都发布了MiMo-V2.5系列大模型,手机厂商也来分一杯羹

    1900编辑于 2026-04-26
  • 来自专栏低代码平台

    Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病

    DeepSeekV4的Vision模式已经在规划中,开放后这个问题会从根本上解决。另一个坑:上下文太长会炸当对话内容堆积到一定量时,模型直接炸了。

    43400编辑于 2026-04-24
  • 代号「土豆」,6万亿参数只激活10%——拆解GPT-6的Symphony架构,OpenAI怎么把大模型重做了一遍

    更关键的是,DeepSeekV4计划在4月底发布,如果性能继续提升而价格保持低位,对OpenAI的压力会非常大。开源模型的崛起。

    22110编辑于 2026-04-21
领券