首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏算法一只狗

    DeepSeek 开源的FlashMLA到底是什么

    DeepSeek之前开源的FlashMLA,其github仓库代码已经来带了6000+的stars数量了,果然DeepSeek团队才是真正的OpenAI。 它其实总结下来就是两个关键的信息适配DeepSeek中自研的MLA,能够有效加速MLA的推理速度。其实MLA技术一开始就是DeepSeek-V2中训练的一种方法。 而DeepSeek-V2提出的MLA(Multi-Head Latent Attention),在KV缓存数量上略大于GQA(2.25组),但具备恢复完整MHA效果的能力。 从部署使用上看,其用法相当简单,只需要安装对应的依赖,然后像下面一样调用即可DeepSeek团队在首日就开源了FlashMLA,相信在接下来的几天内,社区会有更多实践和应用落地。 DeepSeek正用行动证明,他们不仅仅是开源的践行者,更是AI技术普惠化的推动者。

    32210编辑于 2025-03-18
  • 来自专栏大模型系列

    万字长文详解DeepSeekDeepSeek是什么-超长上下文

    成立不到三年,DeepSeek已发布包括DeepSeek-Coder、DeepSeek-MoE、DeepSeek-VL、DeepSeek-R1等多个重量级模型,在代码生成、混合专家架构、多模态理解与推理能力等方面实现多项突破 本文将从技术演进、核心架构、开源生态、应用场景、产业影响五大维度,全面剖析DeepSeek的技术内核与发展路径。一、DeepSeek是什么? 阶段三:迈向通用智能——DeepSeek-VL与DeepSeek-R1(2025–2026)DeepSeek-VL:支持图文理解、OCR、视觉问答等多模态任务。 4.多模态融合(DeepSeek-VL)采用Q-Former+VisionEncoder架构。支持图像描述、表格理解、手写识别等任务。可与语言模型无缝协同,实现“看图写代码”“读表做分析”等高级功能。 支持4-bit/8-bit量化,可在消费级GPU(如RTX4090)运行。社区贡献活跃,衍生出大量微调版本(如DeepSeek-Math、DeepSeek-Law)。

    2.7K60编辑于 2026-04-06
  • 来自专栏技术热文

    DeepSeek R1 集成难题完美解决:DeepSeek4j来帮你解决

    DeepSeek R1 集成难题完美解决:DeepSeek4j来帮你解决在人工智能技术飞速发展的今天,DeepSeek R1 凭借其强大的思维链能力和高效的性能,成为开发者们关注的焦点。 幸运的是,DeepSeek4j 的开源为这一难题提供了完美的解决方案。为什么需要 DeepSeek4j? DeepSeek4j 的优势DeepSeek4j 是专为 Java 生态打造的 DeepSeek R1 集成框架,其核心优势如下:完整保留思维链和账单:完美支持 DeepSeek R1 的思维链能力,确保推理过程完整保留 如何在 Spring Boot 项目中快速集成 DeepSeek4j环境准备在集成 DeepSeek4j 之前,确保开发环境满足以下条件:Java 版本:DeepSeek4j 支持 Java 8 及以上版本 来使用 DeepSeek4j 提供的 API。

    39510编辑于 2025-03-31
  • 来自专栏码匠的流水账

    langchain4j+ollama+deepseek小试牛刀

    序本文主要研究一下如何使用langchain4j集成ollama+deepseek步骤pom.xml <dependency> <groupId>dev.langchain4j langchain4j-spring.version}</version> </dependency> <dependency> <groupId>dev.langchain4j model-name: deepseek-r1:8bcontroller@RequestMapping("/ollama")@RestControllerpublic class ChatController prompt=%E4%BD%A0%E6%98%AF%E8%B0%81可以得到您好!我是由中国的深度求索(DeepSeek)公司开发的智能助手DeepSeek-R1。 小结langchain4j提供了langchain4j-ollama-spring-boot-starter,可以方便地通过ollama去访问deepseek。doclangchain4j

    1.3K00编辑于 2025-02-23
  • 来自专栏码匠的流水账

    langchain4j+ollama+deepseek小试牛刀

    序 本文主要研究一下如何使用langchain4j集成ollama+deepseek 步骤 pom.xml <dependency> <groupId>dev.langchain4j >dev.langchain4j</groupId> <artifactId>langchain4j-ollama-spring-boot-starter</artifactId :11434 model-name: deepseek-r1:8b controller @RequestMapping("/ollama") @RestController public prompt=%E4%BD%A0%E6%98%AF%E8%B0%81 可以得到您好!我是由中国的深度求索(DeepSeek)公司开发的智能助手DeepSeek-R1。 小结 langchain4j提供了langchain4j-ollama-spring-boot-starter,可以方便地通过ollama去访问deepseek。 doc langchain4j

    54610编辑于 2025-02-25
  • 来自专栏爱可生开源社区

    是什么原因导致慢 SQL?问问 ChatDBA 和 DeepSeek

    下面让我们正式进入《一问一实验:AI 版》第 63 期,看看 ChatDBA 最新效果以及与热门大模型 DeepSeek-R1 在 慢 SQL 优化方面 的效果对比(结尾)。 ChatDBA 与 DeepSeek 解决数据库故障的能力对比。 问题 是什么导致了慢 SQL?如何优化? 4. 为什么调整 tmp_table_size 会立刻见效? ChatDBA VS DeepSeek DeepSeek 的回答 登录 DeepSeek 官网,提出相同的问题。 上下滑动查看交互截图 对比总结 ChatDBA 相较于 DeepSeek-R1 的优势总结如下: 1.

    35110编辑于 2025-06-17
  • 来自专栏一臻AI

    DeepSeek之后,10万一个的Manus到底是什么

    这画面,不禁让我想起几年前刚推出GPT-4时的疯狂。 但是...等等,Manus到底是个啥?为什么突然这么火? 从"AI会说"到"AI会做"的飞跃 如果说ChatGPT和DeepSeek只是会说话的AI,那Manus就是真正会干活的AI。 以前你对AI说:"帮我分析这些简历。" 阅读Github上的代码,理解项目结构并绘制系统架构图 4. 多模态内容生成(可输出PPT/HTML/音视频) 4. 多代理协同工作系统 它甚至在AI"高考"GAIA测试中超越了OpenAI,展现出了惊人的任务拆解和执行能力。 继DeepSeek之后,又一个让全球瞩目的国产AI产品诞生了。 创始人是90后,之前做过壹伴助手这个产品(很多公众号作者都在用),然后卖掉后继续创业,现在又带来了Manus这个颠覆性产品。

    23310编辑于 2025-03-07
  • 来自专栏翎野君

    1.log4j是什么

    1.log4j是什么? 在强调可重用组件开发的今天,除了自己从头到尾开发一个可重用的日志操作类外,Apache为我们提供了一个强有力的日志操作包-Log4j。 2.log4j的概念  Log4j中有三个主要的组件,它们分别是 Logger、Appender和Layout。   3.log4j的配置文件 其实也可以完全不使用配置文件,而是在代码中配置Log4j环境。但是,使用配置文件将使您的应用程序更加灵活。 配置日志的输出目的地Appender Log4j提供的appender有以下几种:   org.apache.log4j.ConsoleAppender(控制台)   org.apache.log4j.FileAppender ),   org.apache.log4j.TTCCLayout(包含日志产生的时间、线程、类别等等信息)  4.在Maven项目中加入log4j <1>在pom.xml中加入依赖jar包 添加Jar

    86410编辑于 2023-05-12
  • 来自专栏大模型系列

    DeepSeek是什么?一文看懂国产开源大模型 DeepSeek 的功能、特点与使用方法

    第二章:技术演进——从 V3 效率革命到 V4 架构前瞻 DeepSeek 的技术路线可分为两个阶段:已落地的 V3 体系 与 基于论文的 V4 前瞻。 2.2 DeepSeek V4:下一代架构的三大支柱(技术前瞻,截至 2026 年 3 月) 虽然 V4 尚未正式发布,但 DeepSeek 在 2025–2026 年发布的三篇论文已勾勒出其技术蓝图: 2.3 DualPath 推理框架:智能体时代的“加速引擎”(2026 年 2 月发布) 如果说 V4 是“大脑”,那么 DualPath 就是让大脑高速运转的“血液循环系统”。 第五章:未来展望——站在新起点的 DeepSeek 5.1 短期焦点(2026–2027) V4 正式发布:预计聚焦编程能力极致优化,对标 Claude Code、Cursor;智能体落地:招聘“智能体数据评估专家 从 V3 的效率革命,到 DualPath 的智能体加速,再到 V4 的架构前瞻,DeepSeek 正在证明:中国不仅能做出好用的大模型,更能定义下一代 AI 的基础设施标准。

    4.3K40编辑于 2026-03-27
  • 来自专栏菩提树下的杨过

    longchain4j 学习系列(2)-调用远程deepseek

    接上一篇继续,longchain4j支持open-ai兼容的各种模式,包括deepseek 一、修改pom依赖 1 <! -- LongChain4j OpenAI Integration (支持DeepSeek) --> 2 <dependency> 3 <groupId>dev.langchain4j</groupId 配置类 15 * 用于配置LongChain4j与DeepSeek大模型的连接 16 * 17 * @author 菩提树下的杨过 18 * @version 1.0.0 19 */ 20 @ 配置 2 deepseek: 3 api-key: ${DEEPSEEK_API_KEY:your-deepseek-api-key-here} 4 base-url: https://api.deepseek.com 四、longchain4j的优势 试想一个场景:假如我们做的是1个多租户的大型AI应用,有多个租户都使用deepseek,每个租户都有自己的api key,这时候如果还使用yaml配置文件写死,启动时全都创建好实例就太不灵活了

    42310编辑于 2025-09-29
  • 来自专栏电子工程师成长日记

    DeepSeek学嵌入式4:蜂鸣器使用

    具体实现功能: 使用DeepSeek编写C语言代码,实现蜂鸣器响停。 51系列单片机具有以下标准功能: 8k字节Flash,512字节RAM, 32位I/O口线,看门狗定时器, 内置4KB EEPROM, MAX810复位电路, 三个16位定时器/计数器, 一个6向量2级中断结构

    39410编辑于 2025-03-27
  • 来自专栏Linux运维技术之路

    Deepseek 和Open Ai 大模型最大区别是什么

    • OpenAI(如 GPT-4): • 采用 稠密模型架构,所有参数在每次推理时都被激活。 • 虽然计算量大,但模型整体一致性强,适合通用任务。 2. • OpenAI: • 参数量也很大(如 GPT-4 据传有上万亿参数),但所有参数在推理时都被激活,计算成本高。 • 需要强大的硬件支持,适合对性能要求极高的场景。 3. • OpenAI: • GPT-4 的训练数据规模未公开,但预计也在数万亿 token 级别。 • OpenAI 的数据来源多样,包括书籍、网页、代码等。 4. • OpenAI: • 部分模型(如 GPT-2)已开源,但最新模型(如 GPT-4)仅通过 API 提供服务,商业化程度高。 总结 特性 DeepSeek OpenAI(如 GPT-4) 架构 MoE(混合专家) 稠密模型 参数量 6710 亿(激活 370 亿) 上万亿(全激活) 计算效率 高效(动态激活参数) 计算成本高(

    4K10编辑于 2025-02-04
  • 来自专栏C++

    DeepSeekDeepSeek概述 | 本地部署deepseek

    1 -> 概述 DeepSeek是由中国的深度求索公司开发的一系列人工智能模型,以其高效的性能和低成本的训练而受到关注。 知识蒸馏:DeepSeek-R1通过知识蒸馏,将长链推理(CoT)模型的推理能力蒸馏到标准LLM中,显著提升了推理性能。 推动行业变革:DeepSeek的成功挑战了传统的“大力出奇迹”的AI发展模式,为行业提供了新的发展思路和方向,激发了更多的创新和探索。 2.2 -> 部署deepseek-r1模型 回到ollama官网点击左上角的Models进入如下界面。 这样本地部署deepseek就算完成啦

    3.5K32编辑于 2025-02-08
  • 来自专栏海天一树

    Neo4j学习(1):Neo4j是什么

    1.2 用 Traversal 进行数据库查询   一次 Traversal, 你可以理解为是你通过一种算法,从一些开始节点开始查询与其关联的节点,比如你想找到 “我朋友喜欢但我不喜欢的那首音乐是什么呢 1.3 Neo4j是一个图数据库 Neo4j 是目前最流行的图形数据库,支持完整的事务,在属性图中,图是由顶点(Vertex),边(Edge)和属性(Property)组成的,顶点和边都可以设置属性,顶点也称作节点 Neo4j创建的图是用顶点和边构建一个有向图,其查询语言cypher已经成为事实上的标准。 在Neo4j中,节点和关系都可以包含属性 ? 1.png 下面让我们认识一个最简单的节点,他只有一个属性,属性名是name,属性值是Marko: ? Neo4j提供了遍历的API,可以让你指定遍历规则。最简单的设置就是设置遍历是宽度优先还是深度优先。

    2.3K11发布于 2018-10-08
  • 来自专栏前端黑板报

    4 - JavaScript 中的对象是什么

    字符串中的空格,例如:"middle name" 4. 字符串中的数值,例如:"007" 对象如何删除一个属性?

    87730编辑于 2022-04-19
  • 来自专栏AgenticAI

    DeepSeek4或已在训练中了,要元旦献礼了吗?

    博主今天在用DeepSeek时候,突然遇到久违的"服务器繁忙,请稍后再试"!反复重试的结果都是“服务器繁忙,请稍后重试”。 我以为我只是个例,然而DeepSeek官方交流群,也有部分同学遇到。 所以你就说他是不是在训个下一代比如DeepSeek4,准备献礼元旦? 根据之前发布的DeepSeek-OCR,可以将输入的图像或者文字进行高效压缩,所我们可以合理的推测下一个DeepSeek4大概率是多模态了,并且还是类似Google Gemini那样的长上下文。

    19510编辑于 2025-11-29
  • 来自专栏AI技术探索和应用

    打破信息差,小白也可以知道最近大火的DeepSeek是什么

    什么是DeepSeekDeepSeek的官网:https://www.deepseek.com/ DeepSeek是一款基于深度学习技术的人工智能平台,它能够模拟人类的思维过程,通过大量的数据学习和自我优化,从而提供精准的预测和决策支持 效果好 根据DeepSeek官方给出的在测评效果,DeepSeek 最新的V3版本的模型效果已经可以与OpenAI的 GPT-4o模型相媲美了,部分数据集测评的效果分数对比如下,更多数据可以参考官网首页 成本低 DeepSeek模型训练成本估计只有 OpenAI和GPT 4o和Meta公司的Llama 3.1 405B 模型的十分之一不到,这两者的效果还不如DeepSeek最新模型。 教育领域:DeepSeek可以根据学生的学习情况,提供个性化的学习建议,提高学习效果。 Deepseek的未来展望 Deepseek的出现,标志着AI技术进入了一个新的阶段。

    2K21编辑于 2025-02-24
  • DeepSeek-7B-chat 4bits量化 QLora 微调

    DeepSeek-7B-chat 4bits量化 QLora 微调 概述 本节我们简要介绍如何基于 transformers、peft 等框架,对 DeepSeek-7B-chat 模型进行 Lora /deepseek-ai/deepseek-llm-7b-chat/', use_fast=False, trust_remote_code=True) tokenizer.padding_side = 如果设置为True,则在4位精度下加载模型。 bnb_4bit_compute_dtype=torch.half, # 4位精度计算的数据类型。 bnb_4bit_quant_type="nf4", # 4位精度量化的类型。这里设置为"nf4",表示使用nf4量化类型。 ) model.generation_config = GenerationConfig.from_pretrained('/root/model/deepseek-ai/deepseek-llm-7b-chat

    52610编辑于 2025-07-17
  • 来自专栏石云升

    DeepSeek 新版本(V4?),内附升级方法

    DeepSeek 更新了V4? 下午5点左右,DeepSeek更新了一个新模型,据说是个小模型,整理能力我个人觉得比3.2是强一点的,但还比不上谷歌的Gemini 3,所以不确定是不是V4。 是不是很神奇,其实离DeepSeek R1发布才1年多,恍如隔世。

    95310编辑于 2026-03-17
  • 来自专栏生信菜鸟团

    DeepSeek助力快速生成DNBC4tools所需样本对应信息

    工欲善其事 必先利其器 前面我们介绍了华大 DNBelab C SeriesTM 单细胞转录组定量的基本流程: DNBC4tools—华大DNBelab系列单细胞分析pipeline 明确需求 其中在准备样本数据步骤有提到 sample.tsv 文件格式是: $sample1 /data/cDNA1_R1.fq.gz;/data/cDNA1_R2.fq.gz /data/oligo1_R1.fq.gz,/data/oligo4_ R1.fq.gz;/data/oligo1_R2.fq.gz,/data/oligo4_R2.fq.gz  $sample2 /data/cDNA2_R1.fq.gz;/data/cDNA2_R2.fq.gz DeepSeek 助力 初步观察这个需求实现起来还是挺复杂的,以前往往需要花费一定时间来进行代码实现。现在AI盛行,这个时候我们就可以使用DeepSeek来快速生成我们需要的代码。 详见: DNBC4tools—华大DNBelab系列单细胞分析pipeline 玩转服务器—从前台到后台,让你的任务无忧运行

    31700编辑于 2025-06-11
领券