作者: HOS(安全风信子) 日期: 2026-02-05 主要来源平台: ModelScope 摘要: DeepSeek-OCR-2 作为 DeepSeek 团队开源的第二代 OCR 模型,基于 团队推出的 DeepSeek-OCR-2 正是为了解决这些痛点而生。 根据 ModelScope 平台的最新动态,DeepSeek-OCR-2 采用了全新的技术架构,实现了语义推理级的文档理解能力,为各类文档处理场景提供了更强大的解决方案。 2. -2 - ModelScope官方页 辅助:DeepSeek GitHub - DeepSeek-OCR 开源代码 附录(Appendix): 环境配置与超参表 配置项 推荐值 说明 Python版本 -2 文档理解服务") as demo: gr.Markdown("# DeepSeek-OCR-2 文档理解服务") gr.Markdown("基于DeepSeek-OCR-2的文档理解服务
今天,小异带来一本新书《DeepSeek 原理与项目实战》,这本书还未正式出版,便已引发广泛关注,其中文繁体版和英文版版权更是抢先售出,收获了读者们如潮的好评。 当技术爆炸遇见知识鸿沟,《DeepSeek 原理与项目实战》这本兼顾理论深度、技术广度和实践经验的好书,便为读者打开了通向DeepSeek世界的大门。 实战与高级集成应用 理论和工具都学会后,就要动手实战了,第三部分(第 10~12章)详细讲解了从函数回调、缓存机制到实际应用开发的全流程。 集成实战1:基于LLM的Chat类客户端开发 集成实战2:AI 智能助理开发 集成实战3:基于VS Code的辅助编程插件开发 Part.3 结语 在当下大模型技术快速迭代的浪潮中,本书以技术前瞻性、实战系统性和应用普适性形成显著特色 ● 实战系统性:突破传统技术书籍重理论轻实践的局限,从生成式AI的理论基础讲解到DeepSeek-V3的技术架构,再到具体的开发实践,构建了从模型部署、参数微调到应用落地的全链路技术框架。
我是程序员 NEO 让我们开始今天的技术分享~ 想让 DeepSeek 生成精美图片吗?本文将为您揭示一个简单而强大的解决方案,让您轻松实现 AI 创意的可视化呈现。 突破 DeepSeek 的限制 DeepSeek 作为新晋的 AI 助手,虽然在对话能力上表现出色,但并不直接支持图像生成功能。 不过,通过本文介绍的方法,我们可以轻松突破这一限制,让 DeepSeek 秒变"画家"。 核心解决方案 关键在于利用 Pollinations.ai 提供的图像生成 API。 =100&model=flux&nologo=true 参数说明: width/height:控制图片尺寸 seed:随机种子,保证图片的可重复性 nologo=true:去除水印,获得清晰原图 实战指南
Deepseek & RAG 实战 编者常常有许多材料需要阅读查阅,但自己又比较懒,为此,想在大模型的学习过程中基于RAG技术将本地知识库与大模型结合起来,加快自身的效率。 在本次的项目设计,需要达成以下目标: 开源大模型的本地部署及使用 (以Deepseek为例); PDF文本分析 ➕ 相似prompt检索提取 (关键); 将检索到的信息与原prompt结合作为输入,得到结果 : f"""请根据以下参考内容回答问题: {retrieved} 问题:{query}"""}]4️⃣ 模型部署mode_name_or_path = '/root/autodl-tmp/deepseek-ai /deepseek-llm-7b-chat'# 加载预训练的分词器和模型tokenizer = AutoTokenizer.from_pretrained(mode_name_or_path, trust_remote_code
问题: #5.2.3-1 | 测试SpittleController处理针对“/spittles”的GET请求 回答:
Deepseek & RAG 实战(二)在【大模型学习 | RAG & DeepSeek 实战】-腾讯云开发者社区-腾讯云文章中,已经实现了基于RAG建立了本地知识库,通过检索相似度最高的知识来辅助大模型的问答系统
让长文本处理又快又好的新方法:NSA 原⽣稀疏注意⼒机制 最近,DeepSeek 在优化大语言模型的长文本处理能力上取得了新突破。 传统模型在处理一篇小说或整个代码库时,常因计算量过大而卡顿。 DeepSeek 提出的NSA(原⽣稀疏注意⼒机制),像给模型装上了“智能滤网”,既能抓住关键信息,又大幅降低了计算负担,速度直接提升 11.6 倍。 一、问题:长文本处理为何如此吃力? 三、实战表现:又快又聪明的“双料冠军” DeepSeek 在 270 亿参数模型上做了全面测试: • 常规任务:在数学推理(GSM8K)、代码生成(HumanEval)等 9 项测试中NSA7 项领先。
参考资料 唐建法,《MongoDB高手课》(极客时间) 郭远威,《MongoDB实战指南》(图书) 作者:周旭龙 出处:https://edisonchou.cnblogs.com 本文版权归作者和博客园共有
模型 文件名 任务 推理 验证 训练 导出 yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.pt 检测 ✅ ✅ ✅ ✅ yolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.pt 实例分割 ✅ ✅ ✅ ✅ yolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.pt 姿态/关键点检测 ✅ ✅ ✅ ✅ yolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.pt 定向检测 ✅ ✅ ✅ ✅ yolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt YOLO11 yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.pt Detection ✅ ✅ ✅ ✅ YOLO11-seg yolo11n-seg.pt
在这一技术浪潮中,国内头部云厂商加速布局AI基础设施与工具链建设,其中腾讯云凭借其Deepseek系列大模型与**高性能AI计算实例(HAI)**的深度整合,为开发者提供了从模型训练到应用落地的全栈解决方案 操作过程:第一步:跳转链接https://cloud.tencent.com/act/pro/deepseek2025#HAI-CPU购买一个体验版的HAI,用于本次部署HAI的必要条件;第二步:点击立即购买选择一个可以购买的资源 所以说要选择一个可以购买的进行支付即可;第三步:进行支付支付成功:选择已成功支付即可;第四步:登录cnb.cool地址登录成功:第五步:跳转这个地址https://cnb.cool/ai-awesome/deepseek 但是如果只是根据视频进行搭建还是会存在一定的问题,只有实际搭建的时候,才会发现一些问题,当然了搭建好了模型之后只是第一步,如何根据搭建的服务进行调用,才是最重要的,这个点后续会继续更新对应的文章进行介绍,毕竟现在搭建deepseek
背景 deepSeek在2025年春节期间火爆全球,微信朋友圈,头条,抖音,快手,微博等热门平台,无处不在。 从图片中可以看出: 第一,第四,第六个对比维度, DeepSeek以微弱的优势比OpenAI的o1正式版。 对比下来,deepSeek回答得更全面。 资料阅读 1 deepSeek网上的宣传资料阅读 1.提问技巧: a.我要xx,要给xx用,希望达到什么效果,但是担心什么问题。 2.deepseek是中国超过美国了吗? 基建是美国起源的,deepseek只是一个大语言模型,应用层面的领先。 3.deepseek跟openai还有哪些不具备的能力。 小结 DeepSeek通过开源火遍全世界,很可能像docker撬动容器化时代一样,撬动AI时代。
一、功能概述 DeepseekScanner实现了扫描源代码项目中的所有代码文件发送给deepseek进行安全审计的功能。 具体细节包括扫描所有子目录中的代码文件,然后依次将代码文件切片发送到deepseek api进行智能代码审计。审计结果包含存在安全问题的代码文件、代码位置行数、安全漏洞问题名称、存在安全漏洞的代码块。 save_results_to_file(filepath, file_scan_results) except Exception as e: print(e) 2.代码文件切片发送给deepseek 做安全审计 //从项目中的各个目录提取代码文件后,开始对代码进行切片发送给deepseek做安全审计 def scan_file(file_path, scan_results, directory): 对项目中的所有代码进行安全审计 python scanner.py E:\work\sqli-secound-order --all 2.结果展示 四、总结 DeepseekScanner通过python+deepseek
如何用DeepSeek优化代码生成? 实战案例分析一、DeepSeek的技术特点与优势DeepSeek是一款基于大规模预训练模型的代码生成工具,具有以下特点和优势:多任务能力:支持代码生成、代码补全、代码优化等多种任务。 二、实战案例:使用DeepSeek生成代码案例1:快速生成快速排序算法以下是使用DeepSeek生成快速排序算法的代码示例:from transformers import AutoTokenizer, AutoModelForCausalLM# 加载模型和分词器tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-coder- 使用上下文数据DeepSeek可以根据项目上下文生成符合规范的代码。例如,在电商系统中,它可以自动生成折扣计算逻辑。四、总结与展望DeepSeek在代码生成和优化方面展现了强大的能力。
关于DeepSeek模型简介DeepSeek是由腾讯控股,中国知名私募巨头幻方量化旗下的人工智能公司深度求索(DeepSeek)自主研发的AI大模型。 DeepSeek致力于研究和开发先进的通用人工智能模型AGI,其模型包括DeepSeek LLM、DeepSeek MoE、DeepSeek V2、DeepSeek-V3等,并且全部开源。 DeepSeek是基于Transformer架构,广泛应用于自然语言处理任务,比如文本分类、情感分析、机器翻译等,DeepSeek模型具有以下特点:高性能:基于Transformer架构,性能卓越。 从零开始:DeepSeek模型训练接下来就来从头开始进行DeepSeek模型训练。(一)准备工作在开始训练之前,需要做些准备工作,如下所示:注册腾讯云账号:访问腾讯云官网,注册账号并完成实名认证。 1、创建训练任务在TI One平台上创建一个新的训练任务,选择DeepSeek模型,并配置训练参数。
01、接入Kimi-K2.5模型 上一篇总结了OpenClaw的运行原理和基于MimiMax模型的部署实战:Agent之最新OpenClaw原理与实战大全 这篇将整合DeepSeek和Kimi模型,OpenClaw openclaw.json文件如下: { "meta": { "lastTouchedVersion": "2026.2.22-2", "lastTouchedAt": "2026-02-23T11 https://api.routin.ai/v1", "OPENAI_API_KEY": "" }, "wizard": { "lastRunAt": "2026-02-23T11 02、接入DeepSeek OpenClaw里面的列出来的模型里面没有deepseek。 : { "deepseek": { "baseUrl": "https://api.deepseek.com/v1", "apiKey": "${DEEPSEEK_API_KEY
以下是一篇结合DeepSeek技术解析与代码示例的技术文章,重点展示其核心算法实现与落地应用:DeepSeek技术解析:MoE架构实现与代码实战作为中国AI领域的创新代表,DeepSeek在混合专家模型 本文将通过代码实例解析其核心技术,并展示如何基于DeepSeek-MoE框架实现高效推理。 DeepSeek的 「专家位置感知调度」 算法通过:预分析计算图,将高频共现的专家分配到同物理设备采用RDMA网络传输协议,降低跨节点通信延迟一、MoE架构设计原理DeepSeek的稀疏化MoE架构通过动态路由机制 结语通过代码实践可以看出,DeepSeek的技术优势源于算法创新与工程优化的深度结合。 未来应用deepseek将更加广泛
项目本身是包含增删改查功能的,这些就是要关联到数据库和后端的功能。所以之前先拿公告功能练练手,有的小伙伴会觉得,AI都已经这么牛逼了,让AI生成这个功能不就好了么?
1 -> 概述 DeepSeek是由中国的深度求索公司开发的一系列人工智能模型,以其高效的性能和低成本的训练而受到关注。 知识蒸馏:DeepSeek-R1通过知识蒸馏,将长链推理(CoT)模型的推理能力蒸馏到标准LLM中,显著提升了推理性能。 推动行业变革:DeepSeek的成功挑战了传统的“大力出奇迹”的AI发展模式,为行业提供了新的发展思路和方向,激发了更多的创新和探索。 2.2 -> 部署deepseek-r1模型 回到ollama官网点击左上角的Models进入如下界面。 这样本地部署deepseek就算完成啦
该培训中提及的技术只适用于合法CTF比赛和有合法授权的渗透测试,请勿用于其他非法用途,如用作其他非法用途与本文作者无关
Week12 2016/11/30上午1-4节 一、复习 二、使用地图 1、window.navigator 对象包含有关访问者浏览器的信息。