671B MoE 模型的 1,400 行推理参考实现——通过 MLA(Multi-head Latent Attention)实现 28.5 倍 KV Cach...
[!NOTE] 在前两期中,老周带大家部署了 DeepSeek TUI 并掌握了“黄金洗稿指令”。但如果手头有几十甚至上百个杂乱的历史...
[!NOTE] 上一期老周带大家在终端部署好了带分栏面板的 DeepSeek TUI,体验了两行大白话清洗文档的震撼。今天第二篇,我们...
很多人跟风下载了 Obsidian,却被复杂的双链、MOC 概念和繁琐的插件语法直接劝退,让知识库沦为了“笔记坟墓”。本系列不谈复杂理论,今天第一篇教大家用国外...
摘要: 飞书知识库擅长协作但AI能力需外接DeepSeek,ima.copilot原生集成三大模型与copilot Agent,搜读写一体、微信生态直连,同时支...
ima内置DeepSeek V4-Flash、智谱GLM-5.1、Tencent Hunyuan-Hy3 preview三款模型,分别擅长通用推理、复杂分析、长...
2025年08月21日,deepseek悄悄发布 DeepSeek V3.1,具体更新了啥,可以看官方文档:DeepSeek-V3.1 发布
参数规模是模型能力的基础,GPT 与 DeepSeek 在总参数量、推理激活参数、上下文窗口三大核心指标上差异显著,且 DeepSeek 后续版本呈现 “总参数...
过去一年,GEO(Generative Engine Optimization,生成式引擎优化)无疑是营销界最受瞩目的概念。但在所有讨论中,最核心的问题始终悬而...
近期,市场上关于 DeepSeek 可能启动首轮外部融资的消息不断发酵。传闻中的融资规模不小,估值也相当可观,甚至有产业资本可能参与其中。我觉得,属于 Deep...
腾讯 | 前端开发工程师 (已认证)
接下来,我就以Codex接入DeepSeek为例,实机演示一遍,如何让 Codex 通过 AICodeSwitch 使用 DeepSeek 作为后端模型。
腾讯 | 高级前端工程师 (已认证)
巨头亲手终结了自己创造的对话范式,向超级智能体应用狂奔;而在另一端,开源基石正承受代码泛滥带来的信任撕裂,企业端则用真金白银做出了最现实的成本选择。以下是今天的...
完成安装后,先不要管。我们还需要安装另外一款工具CC Switch。 CC Switch 是一款跨平台桌面应用,专为使用 AI 编程工具的开发者设计。可实现一...
石化盈科信息技术有限责任公司 | 算法工程师 (已认证)
今年上半年最密集的一波架构创新,全都在这个点上。DeepSeek出了NSA,Kimi出了MoBA,MiniMax在M3上换了MSA。三家头部一起对注意力机制动刀...
我让国内几个大语言模型以高考全国卷主题《词语》为题,写一篇高考作文,用的模型分别是文心、混元、豆包、Minimax、kimi、GLM、Deepseek、Qwen...
6月3日消息,DeepSeek正式启动首轮大额融资,目标募资总额约 500亿元,融资完成后估值预估落在 3500亿-4000亿元 区间。这是2026年迄今全球A...