首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏C++

    DeepSeekDeepSeek概述 | 本地部署deepseek

    1 -> 概述 DeepSeek是由中国的深度求索公司开发的一系列人工智能模型,以其高效的性能和低成本的训练而受到关注。 知识蒸馏:DeepSeek-R1通过知识蒸馏,将长链推理(CoT)模型的推理能力蒸馏到标准LLM中,显著提升了推理性能。 推动行业变革:DeepSeek的成功挑战了传统的“大力出奇迹”的AI发展模式,为行业提供了新的发展思路和方向,激发了更多的创新和探索。 2.2 -> 部署deepseek-r1模型 回到ollama官网点击左上角的Models进入如下界面。 这样本地部署deepseek就算完成啦

    3.3K32编辑于 2025-02-08
  • 来自专栏C++

    DeepSeekdeepseek可视化部署

    1 -> 前文 【DeepSeekDeepSeek概述 | 本地部署deepseek 通过前文可以将deepseek部署到本地使用,可是每次都需要win+R输入cmd调出命令行进入到命令模式,输入命令 ollama run deepseek-r1:latest。 点击使用自己的 API Key 或本地模型 点击第一个Chatbox AI 进入该界面后,点击CHATBOX AI,选择其他的模型提供方 选择Ollama API这个模型提供方 点击模型,会显示已经部署到本地的deepseek

    86820编辑于 2025-02-12
  • 来自专栏猫头虎博客专区

    什么是DeepSeek?如何入门DeepSeek

    什么是DeepSeek?如何入门DeepSeek? 一、DeepSeek是什么? python=3.8 conda activate deepseek # 安装核心库 pip install deepseek-sdk torch>=2.0 2.2 快速体验 通过API调用基础功能 /DeepSeek-7B.git # 启动推理服务 python -m deepseek.serve --model-path . 模型中心:hub.deepseek.com 社区论坛:forum.deepseek.ai 实战教程: 《DeepSeek智能对话机器人开发入门》 《使用DeepSeek-CODEPILOT构建编程助手 》 四、常见问题解答 Q:需要多强的算力才能运行DeepSeek

    13.2K1012编辑于 2025-02-27
  • 来自专栏C++

    DeepSeek】如何在WPS中使用deepseek

    1 -> 背景 随着人工智能技术的发展,大语言模型如ChatGPT、DeepSeek等不断涌现,为提升办公效率提供了新的途径。 2 -> 意义 推动办公智能化:WPS与DeepSeek的结合,推动了办公软件向智能化方向发展,为用户提供了更加智能、高效的办公解决方案。 功能多样化:除了基本的文本处理功能,DeepSeek还支持聊天、文生图、创作等功能,为用户提供了更多的创作可能性和便捷的交互体验。 个性化定制:用户可以根据自己的需求选择不同的DeepSeek模型(如deepseek-chat或deepseek-reasoner),并进行个性化的配置,以适应不同的工作场景。 3 -> 本地部署deepseek 相关文章: 【DeepSeekDeepSeek概述 | 本地部署deepseek 4 -> WPS引入deepseek 下载Office AI 以联想应用商店为例

    91110编辑于 2025-02-15
  • 来自专栏技术

    实践DeepSeek

    作为一名长期关注和实践人工智能技术的爱好者,我体验了腾讯云大模型知识引擎与 DeepSeek 的结合应用,接下来说一下我的感受吧! 腾讯云大模型知识引擎与 DeepSeek腾讯云大模型知识引擎是面向企业客户及合作伙伴的基于大模型的知识应用构建平台。 DeepSeek - R1 是 671B 模型,它经过强化学习训练,在推理过程中会进行大量的反思和验证,思维链长度可达数万字。 DeepSeek - V3 则是 671B 参数的 MoE 模型,在百科知识、数学推理等多项任务上表现突出。 在模型设置中,我毫不犹豫地选择了 “DeepSeek - R1/V3” 模型,并开启了 “联网搜索” 开关。

    17210编辑于 2025-03-20
  • 来自专栏人工智能

    DeepseekDeepSeek-R1训练方式分析

    本博客参考Deepseek开源论文:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning1 .纯强化学习训练的语言模型 DeepSeek-R1-Zero研究者首先提出了一个完全基于强化学习(RL)训练的模型DeepSeek-R1-Zero,该模型不依赖任何有监督微调(SFT)数据。 通过RL训练,DeepSeek-R1-Zero展现出了令人印象深刻的推理能力和自主学习能力。 2.引入冷启动数据的RL模型DeepSeek-R1尽管DeepSeek-R1-Zero取得了优异的性能,但也存在着输出可读性差、语言混用等问题。 DeepSeek-R1已经在这条道路上迈出了坚实的一步。

    81310编辑于 2025-02-12
  • 来自专栏编程杂记

    DeepseekDeepSeek-R1诞生过程

    本博客参考Deepseek开源论文:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 1.纯强化学习训练的语言模型 DeepSeek-R1-Zero 研究者首先提出了一个完全基于强化学习(RL)训练的模型DeepSeek-R1-Zero,该模型不依赖任何有监督微调(SFT)数据。 通过RL训练,DeepSeek-R1-Zero展现出了令人印象深刻的推理能力和自主学习能力。 2.引入冷启动数据的RL模型DeepSeek-R1 尽管DeepSeek-R1-Zero取得了优异的性能,但也存在着输出可读性差、语言混用等问题。 DeepSeek-R1已经在这条道路上迈出了坚实的一步。 总结 DeepSeek-R1-Zero是一个完全基于强化学习(RL)训练的模型在没有任何有监督数据的情况下,通过自我进化掌握了强大的推理能力。

    37610编辑于 2025-02-13
  • 来自专栏AgenticAI

    刚刚DeepSeek开源新模型DeepSeek-OCR

    就在3个小时前,DeepSeek突然在HuggingFace上传新模型DeepSeek-OCR,一个只有3B大小的文档解析新模型,该模型的目标是探索视觉文本压缩的边界。 在生产环境中,DeepSeek-OCR能够以单个A100-40G GPU的计算能力,每天生成 200k+ 页的训练数据,供大语言模型或视觉语言模型使用。 markdown格式输出: prompt = "<image>\n<|grounding|>Convert the document to markdown. " 以下是一些案例: 案例2解析图标: 看来DeepSeek 模型地址:https://huggingface.co/deepseek-ai/DeepSeek-OCR

    28310编辑于 2025-11-29
  • DeepSeek认知之旅

    DeepSeek《认知之旅》记录了DeepSeek V3/R1相关的8篇核心论文,以及最新的原生可训练稀疏注意力机制NSA论文中描述的关键要点,以时间顺序按脑图的形式整理到白板文件中,供大家学习使用。 其中每篇论文的脑图都记录了对应的研究背景、核心贡献、研究方法、评估结果以及一些非常重要的讨论和洞见,用全局视角从这份文件中或可窥得DeepSeek获得如此巨大成功的一些小线索。

    12300编辑于 2025-02-24
  • 来自专栏礼拜八不工作

    iPhoneMirroring与DeepSeek

    有些人看到标题可能会奇怪为什么这个博主要把,iPhoneMirroring与DeepSeek放在一起,该不是又是一个蹭流量博主吧。 第二个主题 :DeepSeek的写作能力探讨 对于 DeepSeek的写作能力,我想如果你阅读过第一篇主题,并且还被它给“骗了”那大概我们能达成一个共识,就是对于文章的撰写,它已经进化到一个不可思议的地步了 在我使用其他AI工具的时候,提示词完全是我给出,而DeepSeek的步骤是,先根据我给出的提示词,进行解释与联想,生成更多,更详细的提示词。 好处肉眼可见,生成的文章质量高了不止一筹,当然这并不是我说其他的AI工具生成的不够好,而是在用户数据输入这个步骤,DeepSeek的创作团队想的更多。 最后,强力推荐下 DeepSeek ,国产且强力又好用,希望你看了这篇文章之后,也去尝试下这个应用。

    88010编辑于 2025-02-04
  • 来自专栏码匠的流水账

    DeepSeek Prompt指南

    序 本文主要研究一下如何写出更适合DeepSeek的Prompt 官方提示库 DeepSeek API 文档-提示库提供了一些DeepSeek 提示词样例。 对于非代码接入的场景,具体可以使用腾讯元器创建一个智能体,通过这个智能体来优化Prompt,再使用优化后的Prompt去DeepSeek执行 [图片] 如果是代码接入的,直接一次调用就可以 from >" ) completion = client.chat.completions.create( model="deepseek-chat", messages=[ 小结 使用AI来回答问题,Prompt的好坏很大程度决定了DeepSeek回答的内容,但是普通人要去学习那些Prompt有些费劲,把这个也交给DeepSeek一举两得。 doc DeepSeek API 文档-提示库

    1.5K10编辑于 2025-02-20
  • 深度解析deepseek

    成本革命:训练成本仅为GPT-4等模型的1/20,如DeepSeek-V3总训练成本仅557.6万美元。二、核心技术体系1. 架构创新混合专家系统(MoE):以DeepSeek-V3为例,总参数671B,每次推理仅激活37B参数,动态分配计算资源提升效率。 三、核心模型家族模型名称核心能力应用场景示例DeepSeek-R1强化学习驱动的逻辑推理专家金融风险评估、医疗诊断辅助DeepSeek-V3混合专家架构的多任务通用模型智能客服、个性化推荐系统DeepSeekChat 七、使用建议与资源官方渠道:官网(https://www.deepseek.com )提供在线体验、API文档与开源代码。 DeepSeek通过技术创新与生态开放,正在重塑AI行业格局。其技术细节可进一步参考官方文档 或研究论文。

    3K20编辑于 2025-04-05
  • 来自专栏Tencent云服务征文

    DeepSeek上云 | 腾讯云HAI如何部署使用DeepSeek

    选择应用 - DeepSeek我们在社区应用下可以找到 DeepSeek-R1 进行选择。这里HAI提供了DeepSeek-R1 1.5B及7B两种模型环境,能够满足用户快速部署和使用的需求。3. 至于算力方案的选择上,对于DeepSeek-R1 1.5B和7B的模型,使用GPU基础型套餐就可以运行。如果想要DeepSeek实现更快的推理回答,就可以选择GPUT进阶型方案。4. DeepSeek使用在点击购买之后,就会跳转到算力管理页面,就可以看到DeepSeek的HAI实例正在创建中。1. 算力连接创建完成之后,就可以看到HAI的实例,这时候我们点击算力连接。 模型选择在上面选择社区应用的时候,我们就知道应用环境内置了DeepSeek-R1 1.5B和7B两个模型。我们可以切换模型。这样,我们就可以使用DeepSeek了。 结语与TIONE安装DeepSeek相比较,HAI也具备了快速部署DeepSeek的能力。通过一键式操作,用户就可以使用云化的DeepSeek

    1.8K50编辑于 2025-02-07
  • 来自专栏高效使用DeepSeek

    【愚公系列】《高效使用DeepSeek》001-什么是DeepSeek

    二、实战中的多面手2.1 金融领域的"数字风控官"在某全国性商业银行的实战应用中,DeepSeek展现出超乎想象的风险洞察力。 3.2 开源的生态策略不同于传统企业的技术封闭,DeepSeek选择将核心代码向全球开发者开放。 4.2 全球布局的新棋局在东南亚市场,DeepSeek针对当地语言多样性推出"方言友好型"版本;在欧洲市场,则重点强化GDPR合规特性。 五、行业变革的启示录DeepSeek的崛起揭示了中国AI发展的新范式:通过底层创新突破算力桎梏,借助开源生态加速应用落地,最终用极致性价比打开市场。 这种技术普惠性,或许才是DeepSeek带给行业最深远的变革——让AI不再是科技巨头的专属玩具,而真正成为推动社会进步的基础设施。

    22400编辑于 2025-03-22
  • 来自专栏测试开发技术

    超详细,DeepSeek 接入PyCharm实现AI编程!(支持本地部署DeepSeek及官方DeepSeek接入),建议收藏!

    DeepSeek作为一款强大的AI模型,凭借其出色的性能和开源免费的优势,成为许多开发者的首选。今天,就让我们一起探索如何将DeepSeek接入PyCharm,实现高效、智能的AI编程。 1、为什么选择DeepSeek + PyCharm? DeepSeek是一款拥有671B参数的混合专家(MoE)模型,其处理速度每秒可达60个Token,性能卓越。 接下来,本文教你两种接入方法: 将本地部署的DeepSeek,接入PyCharm 使用官方的DeepSeek,并接入PyCharm 2、将本地部署的DeepSeek,接入PyCharm DeepSeek 3、使用官方的DeepSeek,并接入PyCharm 1、访问DeepSeek官网(https://www.deepseek.com/),点击“API开放平台”。 点击“设置”按钮,弹出配置文件,将apiKey替换为之前保存的DeepSeek API Key。 5、选择DeepSeek Coder模型,点击连接。

    3.3K71编辑于 2025-02-19
  • 来自专栏老欧说安卓

    DeepSeek】Android开发者在AI时代如何驾驭DeepSeek

    众所周知,DeepSeek如今是炙手可热的国产大模型,以一己之力打崩美国华尔街,让人看到大模型在千行百业的无限可能。 现在DeepSeek更是帮助Android和iOS两大平台的开发者,轻松构建出功能强大的智能应用,满足用户在各种场景下的多样化需求。 那么Android开发者要如何使用DeepSeek助力开发工作呢? 这本新书《DeepSeek移动端AI应用开发:基于Android与iOS》便是移动开发者的好帮手,该书提供了一套从理论到实践的完整指导方案,深入探索如何在移动端(Android与iOS)高效集成DeepSeekDeepSeek移动端AI应用开发:基于Android与iOS》从API集成与数据传输的基础环节入手,逐步深入到插件开发与发布等关键环节,将DeepSeek的强大功能与实际应用场景紧密结合起来,帮助移动开发者掌握智能客服 《DeepSeek移动端AI应用开发:基于Android与iOS》的第4章和第5章深入探讨了Android端应用开发以及DeepSeek在Android平台上的集成实践。

    29900编辑于 2025-04-14
  • deepseek本地部署有什么用?解锁 DeepSeek 本地部署

    DeepSeek 作为一款备受瞩目的大模型工具,其本地化部署逐渐成为众多用户关注的焦点。今天,我们就来深入探讨 DeepSeek 本地部署的用途,为大家详细介绍一款助力本地部署的神器,快来看看吧。​ 一、为什么要进行 DeepSeek 本地部署​DeepSeek 本地部署保障数据隐私,适配敏感行业合规需求。降低网络依赖,无网络也能稳定运行,保障实时场景业务连续。 ,以DeepSeek - R1-7B模型为例。​ 之后,点击【立即体验】进入智能界面体验DeepSeek 本地部署效果。​除了 DeepSeek 模型,DS 本地部署大师还广泛支持豆包、文心一言、通义千问等众多国产大模型。 DS 本地部署大师凭借其强大的功能和便捷的操作,为用户实现 DeepSeek 本地部署提供了一站式解决方案。

    1.6K10编辑于 2025-08-21
  • 来自专栏人工智能

    【人工智能】你知道什么是DeepSeek吗?你有去了解过DeepSeek吗?新手要入门DeepSeek的必经之路——初识DeepSeek

    多家公司宣布将 DeepSeek 集成到自己的产品中,如中国移动的移动云全面上线 DeepSeek ,联通云基于“星罗”平台实现多规格 DeepSeek-R1 模型适配,浙文互联将 DeepSeek-R1 DeepSeek-R1 是幻方量化旗下大模型公司DeepSeek研发的首代开源推理大型语言模型。发布时间:2024年11月20日,DeepSeek-R1-Lite预览版上线网页端。 2025年1月20日,DeepSeek正式发布 DeepSeek-R1 模型,并同步开源模型权重。 结语在今天的内容中我们通过3个问题来认识了DeepSeek:什么是DeepSeekDeepSeek 即深度求索,既是一家人工智能公司,也是其一系列人工智能产品的名称。什么是DeepSeek-R1? DeepSeek-R1 是幻方量化旗下大模型公司DeepSeek研发的首代开源推理大型语言模型。DeepSeek-R1 能够做什么?

    1.3K10编辑于 2025-02-11
  • 来自专栏高效使用DeepSeek

    【愚公系列】《高效使用DeepSeek》005-DeepSeek的对话技巧

    DeepSeek凭借其独特的场景化对话架构与多模态认知引擎,正在重新定义人机交互的边界——它不仅能理解你“说了什么”,更能感知你“为何而说”。 一、DeepSeek的对话技巧1.提问技巧1.1 明确具体目标技巧1:明确需求、场景与约束 错误示例: 帮我写个方案。 缺陷:缺少行业、格式、目标等关键信息。

    51811编辑于 2025-03-18
  • 来自专栏xiaosen

    DeepSeek 全面分析报告

    引言 DeepSeek 是一款由中国人工智能初创公司 DeepSeek 开发的大型语言模型 (LLM),于 2025 年 1 月发布,迅速成为全球人工智能领域的一匹黑马。 DeepSeek 的创始人兼 CEO 梁文锋是一位资深的 AI 专家和量化交易专家,他带领 DeepSeek 团队在短短两年内就取得了令人瞩目的成就。 DeepSeek 的发展历程: 2023 年 7 月:DeepSeek 正式成立,获得 High-Flyer 的资金支持。   2023 年 11 月:DeepSeek 发布 DeepSeek-V2 模型,并在全球开发者中获得认可。   2024 年 1 月:DeepSeek 发布 DeepSeek-V2.5 模型,进一步提升了模型效率和领域知识。  

    2.1K10编辑于 2025-02-23
领券