首页
学习
活动
专区
圈层
工具
发布
首页标签DeepSeek

#DeepSeek

28.5 倍压缩 + 1/10 成本:DeepSeek-V3 如何用数学打败暴力堆卡

用户7411420

671B MoE 模型的 1,400 行推理参考实现——通过 MLA(Multi-head Latent Attention)实现 28.5 倍 KV Cach...

600

几乎不用学!用 DeepSeek + Obsidian 零门槛打造“听得懂人话”的私人知识库(三)

用户12547393

[!NOTE] 在前两期中,老周带大家部署了 DeepSeek TUI 并掌握了“黄金洗稿指令”。但如果手头有几十甚至上百个杂乱的历史...

700

几乎不用学!用 DeepSeek + Obsidian 零门槛打造“听得懂人话”的私人知识库(二)

用户12547393

[!NOTE] 上一期老周带大家在终端部署好了带分栏面板的 DeepSeek TUI,体验了两行大白话清洗文档的震撼。今天第二篇,我们...

900

几乎不用学!用 DeepSeek + Obsidian 零门槛打造“听得懂人话”的私人知识库(一)

用户12547393

很多人跟风下载了 Obsidian,却被复杂的双链、MOC 概念和繁琐的插件语法直接劝退,让知识库沦为了“笔记坟墓”。本系列不谈复杂理论,今天第一篇教大家用国外...

800

飞书知识库+DeepSeek vs ima:职场人该选哪个方案

gavin1024

摘要: 飞书知识库擅长协作但AI能力需外接DeepSeek,ima.copilot原生集成三大模型与copilot Agent,搜读写一体、微信生态直连,同时支...

3800

ima三大模型对比:DeepSeek V4-Flash、GLM-5.1、Tencent Hunyuan-Hy3 preview各有何擅长

gavin1024

ima内置DeepSeek V4-Flash、智谱GLM-5.1、Tencent Hunyuan-Hy3 preview三款模型,分别擅长通用推理、复杂分析、长...

2800

看这一篇就够了!Claude Code 接入四大国产编程模型 DeepSeek、GLM、Qwen、Kimi 全指南

阿坡RPA

2025年08月21日,deepseek悄悄发布 DeepSeek V3.1,具体更新了啥,可以看官方文档:DeepSeek-V3.1 发布

2200

GPT 与 DeepSeek 模型参数有哪些区别?

用户12539106

参数规模是模型能力的基础,GPT 与 DeepSeek 在总参数量、推理激活参数、上下文窗口三大核心指标上差异显著,且 DeepSeek 后续版本呈现 “总参数...

1900

当AI成为信息入口,品牌凭什么被选中?GEO专家卢鑫-虎博科技CEO提出的完整答案

用户11931657

过去一年,GEO(Generative Engine Optimization,生成式引擎优化)无疑是营销界最受瞩目的概念。但在所有讨论中,最核心的问题始终悬而...

1300

浪漫故事翻篇:DeepSeek 融资背后,AI 竞争转向工程落地

Henry Zhang

近期,市场上关于 DeepSeek 可能启动首轮外部融资的消息不断发酵。传闻中的融资规模不小,估值也相当可观,甚至有产业资本可能参与其中。我觉得,属于 Deep...

5910

保姆级教程|AICodeSwitch 让 Codex 秒接 DeepSeek,告别高价 API!

www.tangshuang.net

腾讯 | 前端开发工程师 (已认证)

接下来,我就以Codex接入DeepSeek为例,实机演示一遍,如何让 Codex 通过 AICodeSwitch 使用 DeepSeek 作为后端模型。

64940

OpenAI宣判聊天已死,DeepSeek登顶美国采购榜

随机比特

腾讯 | 高级前端工程师 (已认证)

巨头亲手终结了自己创造的对话范式,向超级智能体应用狂奔;而在另一端,开源基石正承受代码泛滥带来的信任撕裂,企业端则用真金白银做出了最现实的成本选择。以下是今天的...

6210

傻瓜式Codex 接入DeepSeek指南

逍遥子大表哥

完成安装后,先不要管。我们还需要安装另外一款工具CC Switch。 CC Switch 是一款跨平台桌面应用,专为使用 AI 编程工具的开发者设计。可实现一...

1.1K10

一文读懂稀疏注意力,DeepSeek、Kimi、MiniMax为什么集体动了Transformer的根

乐小野

石化盈科信息技术有限责任公司 | 算法工程师 (已认证)

今年上半年最密集的一波架构创新,全都在这个点上。DeepSeek出了NSA,Kimi出了MoBA,MiniMax在M3上换了MSA。三家头部一起对注意力机制动刀...

14310

8个AI,同一道高考作文题,同一个结果:我的那篇最好

黄啊码

我让国内几个大语言模型以高考全国卷主题《词语》为题,写一篇高考作文,用的模型分别是文心、混元、豆包、Minimax、kimi、GLM、Deepseek、Qwen...

8610

AI早报 | 6月5日:DeepSeek 500亿融资启航,微软MAI亮剑,字节Bernini开源,全球AI治理加速

小博测试成长之路

6月3日消息,DeepSeek正式启动首轮大额融资,目标募资总额约 500亿元,融资完成后估值预估落在 3500亿-4000亿元 区间。这是2026年迄今全球A...

50310
领券